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Прелисловие 


Это ли истинный панк-рок, 
Верный, как линия партии? 


У//со, «Тоо Еат Арат» 


Язык С и панк-рок 


В языке С совсем немного ключевых слов, немало острых углов и безграничные 
возможности. Он позволяет сделать абсолютно все. Его изучение можно сравнить 
с гитарными аккордами С, Сир - основные движения освоить легко, а потом всю 
жизнь можно совершенствоваться. Отвергающие С боятся скрытой в нем мощи, 
считая ее небезопасной. По всем рейтингам С неизменно занимает первое место 
среди языков, продвижение которых не спонсируется никакими корпорациями 
или фондами'. 

Языку уже 40 лет, то есть он достиг среднего возраста. Ребята, создавшие его, 
сделали это вопреки желанию руководства — полная аналогия с истоками панк- 
рока, — но случилось это в 1970-х годах, и у языка было достаточно времени, чтобы 
стать популярным. 

Что происходило, когда панк-рок стал популярным? Зародившись в 1970-х 
годах, панк, безусловно, вышел с обочины на большую дорогу. Тиражи альбомов 
таких групп, как Тһе СІаѕћ, Тһе ОЁргіпе, Сгееп "Рау и Тһе Ѕігокеѕ, исчисляют- 
ся миллионами экземпляров, а в местном супермаркете мне доводилось слышать 
легкие инструментальные переложения песен в стиле отпочковашегося от панк- 
рока музыкального жанра «грандж». Бывший солист группы «Слиттер-Кинни» 
теперь ведет популярное комедийное шоу, в котором часто язвительно пародиру- 
ются панк-рокеры?. В ответ на продолжающуюся эволюцию можно было бы за- 
нять жесткую позицию и сказать, что панк – это только то, что было в начале, а все 
остальное — легонький поп-панк для массовой аудитории. Блюстители традиций 
могут слушать свои пластинки 70-х годов, а когда бороздки износятся – скачать 
оцифрованное издание. А своих малолетних отпрысков одеть в «кенгурушки» — 
ностальгируя по группе «Рамонес». 

Чужим этого не понять. Кто-то, слыша слово «панк», представляет себе канув- 
шее в историю явление 1970-х годов – что-то связанное с парнями, которые дела- 
ли нечто необычное. Традиционалисты, которые все еще любят и слушают диски 
Игги Попа, ловят свой кайф, но от того впечатление, что панк закостенел и уже 
неактуален, лишь усиливается. 


Это предисловие, вне всяких сомнений, многим обязано статье Криса Адамсона «Рипк 
Воск Гаприарез А Роепис» по адресу ћеір://ргарргор.сот/тарагіпеѕ/2011-03/рипк- 
госк-Іаприарез. 

С такими стихами, как «Сап’ ре о һеауеп місћ а Сһгее-сһога ѕопе», быть может, Сли- 
тера-Кинни стоило отнести к постпанку? К сожалению, на панк нет стандарта ИСО, па 
который можно было бы ориентироваться, решая, кого куда отнести. 


= 
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Однако вернемся в мир С. Тут тоже есть как традиционалисты, размахивающие 
знаменем со словами АМЗ 89, так и люди, готовые использовать все, что реально 
работает, и даже не знающие, что код, который они пишут, в 1990-е годы нель- 
зя было бы откомпилировать или запустить. Чужаки не замечают разпицы. Они 
видят написанные в 1980-е книги, которые все еще лежат на прилавках, читают 
написанные в 1990-е онлайновые пособия, внимают упертым традиционалистам, 
которые настаивают, что и сегодня нужно писать, как тогда, и даже не понимают, 
что сам язык и его пользователи не застыли в развитии. Печально это – ведь они 
отказываются от поистине замечательных вещей. 

Эта книга о том, как порвать с традицией и вернуть С новизну панк-рока. Я не 
собираюсь сравнивать свой код с оригинальной спецификацией, изложенной 
в книге Кернигана и Ричи 1978 года. В моем смартфоне 512 мегабайт памяти, так 
зачем же авторы учебников по С продолжают на десятках страниц наставлять, 
как сократить размер исполняемого файла на несколько килобайтов? Я пишу 
этот текст на дешевеньком нетбуке, способном выполнять 3 200 000 000 машин- 
ных команд в секунду, так какое мне дело до разрядности операндов команды: 
8 или 16? Мы же в любом случае пишем на С, поэтому наш удобочитаемый, но 
неидеально оптимизированный код все равно будет работать на порядок быст- 
рее, чем сравнимый код на любом другом распухшем от обилия функциональ- 
ности языке. 


Вопросы и ответы (или о параметрах этой книги) 


В. Чем эта книга отличается от других книг по С? 

О. Одни книги лучше написаны, другие даже занимательны, но у всех учебни- 
ков по С есть одна общая особенность (а я прочитал их множество, в том числе 
[реіќе! 2013], [Ст $ 2012], [Кегпіећап 1978], [ Кегпіғһар 1988], [Косһап 2004], 
[ОцаШпе 1997], [Реггу 1994], [Ргака 2004] и [Отар 2004]). По большей части, они 
были написаны до выхода стандарта С99, в котором упрощены многие аспекты 
использования языка. А бывает и так, что в очередное издание книги просто вклю- 
чено несколько замечаний о новшествах, но нет никакого серьезного переосмыс- 
ления способов работы с языком. Во всех говорится, что, возможно, существуют 
библиотеки, которые могут пригодиться в собственном коде, но, как правило, ни 
слова об инструментах установки и экосистеме, благодаря которой эти библио- 
теки оказываются надежными и в разумной степени переносимыми. Материал, 
изложенный в этих учебниках, по-прежнему остается в силе и не утратил ценно- 
сти, только вот современный код на С мало напоминает тот, который приводится 
в предлагаемых примерах. 

Эта книга начинается там, где другие заканчиваются. Сам язык и окружающая 
его экосистема подвергаются пересмотру. Основная сюжетная линия - как поль- 
зоваться библиотеками для работы со связанными списками и анализаторами 
ХМГ, а не разрабатывать собственные с нуля. Это книга о том, как писать удобо- 
читаемый код с дружественным пользователю программным интерфейсом. 
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В. На кого рассчитана эта книга? На экспертов по кодированию? 

О. Предполагается, что у вас есть опыт кодирования на каком-нибудь языке, 
к примеру на Јауа или скриптовом языке типа Рег|. Я не собираюсь объяснять, 
почему программа не должна быть одной длинной процедурой, не разбитой на 
функции. 

В тексте книги предполагается, что читатель обладает базовыми знаниями о С, 
приобретенными в процессе написания кода на этом языке. Длятех, кто подзабыл 
детали или вообще начинает с азов, в приложении А приводится краткий справоч- 
ник по основам С, рассчитанный на владеющих такими скриптовыми языками, 
как Руёћоп или КиБу. 

Наверное, стоит упомянуть, что я написал также учебник по статистическим и 
научным расчетам «Мойе[іпе љміһ Рака» [Кетепз 2008]. Помимо многочислен- 
ных деталей, относящихся к численным методам и использованию статистиче- 
ских моделей для описания данных, там имеется более развернутое и независимое 
руководство по С, в котором, надеюсь, мне удалось преодолеть многие недостатки 
прежних руководств. 

В. Я прикладной программист и не собираюсь копаться в ядре. Зачем мне 
писать на С, а не на скриптовом языке Руёћоп, на котором программировать 
куда быстрее? 

О. Если вы прикладной программист, то эта книга как раз для вас. Сколько раз 
я слышал утверждение, будто С - язык системного программирования; оно страш- 
но далеко от панковского склада ума – да кто они такие, чтобы указывать нам, что 
можно писать, а что — нет? 

Высказывания типа «наш язык почти такой же быстрый, как С, но писать на нем 
проще» уже набили оскомину. Понятно же, что сам С такой же быстрый, как С, 
а задача этой книги – убедить вас в том, что писать на нем проще, чем это следует 
из книг десятилетней давности. Вызывать па110с и забираться в дебри управления 
памятью вам придется даже вполовину не так часто, как системному программис- 
ту 1990-х годов. У нас теперь есть простые средства для работы со строками, и 
даже базовый синтаксис изменился, чтобы сделать код понятнее. 

Я всерьез начал писать на С, когда понадобилось ускорить программу моде- 
лирования, написанную на скриптовом языке К. Как и многие другие скрипто- 
вые языки, К имеет интерфейс к С, которым предлагается пользоваться всякий 
раз, как включающий язык оказывается слишком медленным. В конечном итоге я 
переписал на С так много функций, что от включающего языка вообще отказался. 

В. То, что эта книга понравится прикладным программистам с опытом рабо- 
ты на скриптовых языках, конечно, прекрасно, но я-то занимаюсь кодом ядра. 
Я выучил С в пятом классе, у меня даже сны иногда успешно компилируются. 
Что тут для меня может быть нового? 

О. Последние 20 лет С не стоял на месте. Ниже я расскажу о том, как изме- 
нилась функциональность, гарантированно поддерживаемая любым компилято- 
ром, — благодаря двум новым стандартам С, вышедшим со времен оригинального 
стандарта АМЗ]. Загляните в главу 10, может статься, кое-что в ней вас удивит. 
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В некоторых частях книги, например в главе 6, развенчивающей широко распро- 
страненные ошибочные представления об указателях, рассматриваются вещи, из- 
менившиеся с 1980-х годов. 

Прогресс затронул и окружение. Многие рассматриваемые мной инструменты, 
напримерпаке и отладчик, вам, наверное, знакомы, ноестьдругие, не столь хорошо 
известные. Комплект инструментов АиќоѓооЇѕ полностью изменил представление 
о распространении кода, а система управления версиями СЁ знаменует новый 
подход к коллективной разработке кода. 

В. Не могу не отметить, что примерно в трети книги вообще нет кода на С. 

О. Цель этой книги – рассмотреть то, чего нет в других учебниках С, а пер- 
вым номером в этом списке стоят инструменты и окружение. Если вы не пользуе- 
тесь отладчиком (автономным или входящим в ШЕ), то заметно усложняете себе 
жизнь. Во многих учебниках отладчик вынесен куда-то на задворки, если вообще 
упоминается. Для совместной работы над кодом нужен другой комплект инстру- 
ментов, включающий среди прочего Аиќоѓоо!ѕ и Сі. Код существует не в вакууме, 
и я полагал, что окажу читателям дурную услугу, написав еще одну книгу, осно- 
ванную на предпосылке, будто знание синтаксиса – это все, что необходимо для 
продуктивного использования языка. 

В. Есть много средств для разработки программ на С. Какими критериями вы 
руководствовались при отборе? 

О. Сообщество пользователей С в большей степени, чем многие другие, озабо- 
чено следованием стандартам интероперабельности. Существует масса расшире- 
ний С, предлагаемых в среде СМП, есть интегрированные среды (Т.Е), которые 
работают только в Міпіомѕ, а также расширения компилятора, доступные лишь 
в УМ (Том Геуе| Утаа| Масһіпе – низкоуровневая виртуальная машина). Быть 
может, именно поэтому авторы прежних учебников боялись затрагивать тему ин- 
струментальных средств. Но в наши дни существуют системы, которые работают 
на всем, что мы обычно считаем компьютером. Многие являются частью проекта 
СМО; ПУМ со своим инструментарием быстро набирают популярность, но пока 
еще не являются преобладающими. Где бы вы ни работали – в \УЛп4до\, в іпих, на 
экземпляре, только что полученном от поставщика облачных вычислений, – рас- 
сматриваемые здесь инструменты можно будет установить легко и быстро. Я упо- 
мяну о нескольких платформенно-зависимых инструментах, но всякий раз буду 
явно отмечать это. 

Я не рассматриваю интегрированных сред разработки (Т.Е), потому что вряд 
ли найдутся такие, которые надежно работают на любой платформе (попробуйте 
поставить Есйрзе и подключаемые к ней модули для С на экземпляр Атагоп Е1аѕііс 
Сотрще С]оца), да к тому же выбор ШЕ в высшей степени субъективен. В состав 
типичной ШЕ входит система сборки проектов, которая обычно несовместима 
с аналогичной системой сборки из другой ШЕ. Поэтому файлы проектов ШЕ не- 
возможно использовать для распространения проекта; исключением являются 
случаи, когда все заинтересованные лица обязаны работать с одной и той же ШЕ 
(учебные курсы, некоторые офисы, некоторые вычислительные платформы). 
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В. У меня есть Интернет. Чтобы посмотреть справку по команде или нюансы 
синтаксиса, хватит пары секунд, так зачем мне читать книгу? 

О. Истинная правда: чтобы посмотреть таблицу приоритетов операторов в си- 
стеме Г.1пих или Мас, достаточно набрать команду пап орегафог. Почему же тогда я 
привожу ее в книге? 

У меня точно такой же Интернет, как у вас, и я немало времени провожу в нем, 
читая разные материалы. Поэтому я прекрасно знаю, о чем там не пишут, и это 
именно то, что я включил в книгу. Описывая новый инструмент, например вргоѓ 
или СРВ, я сообщаю то, что необходимо знать, чтобы сориентироваться и задать 
поисковой системе разумные вопросы, а также то, о чем умалчивают другие учеб- 
ники (а это ой как много). 


Станларты: как много левушек хороших 


Если явно не оговорено противное, весь код в книге соответствует стандартам 
150 С99 и С11. Чтобы вы понимали, о чем идет речь, будет уместнд дать краткий 
исторический обзор и перечислить основные стандарты языка С (опуская мелкие 
редакционные правки и исправления). 


К & В (примерно 1978) 
Деннис Ричи, Кен Томпсон и ряд сподвижников придумали язык для напи- 
сания операционной системы Ошх. Впоследствии Брайан Керниган и Ден- 
нис Ричи привели описание языка в первом издании своей книги. Это и был 
первый стандарт де-факто | Кегпіғћап 1978]. 


АМ5І С89 
Компания Ве] ГаБѕ передала курирование языка Американскому нацио- 
нальному институту стандартов (АМФ). В 1989-м был опубликован первый 
стандарт, содержавший ряд усовершенствований, по сравнению с К&К. Во 
второе издание книги К&К была включена полная спецификация языка, 
а это означало, что на рабочих столах десятков тысяч программистов по- 
явился экземпляр стандарта АМ$Т [Кегпіећап 1988]. В 1990 году стандарт 
АМЗГ был принят Международной организацией по стандартизации (ИСО) 
без существенных изменений, но АМЗ] 89 употребляется чаще (и встречает- 
ся на футболках). 


ь 

Прошло десять лет. Язык С стал общепринятым в том смысле, что базовый код 
практически всех ПК и всех интернет-серверов написан на С; пожалуй, трудно во- 
образить более «общепринятое» творение человеческого разума. 

За это время от С откололся С++ и добился значительного успеха (хотя и не 
такого значительного, как С). Появление С++ стало лучшим, что когда-либо про- 
исходило с С. В то время как другие языки обзаводились дополнительными син- 
таксическими конструкциями, чтобы следовать в русле объектной ориентирован- 
пости, и всякими другими фенечками, приходившими на ум их авторам, С строго 
придерживался стандарта. Те, кто хотел стабильности и переносимости, писали 
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на С. Те же, кому были нужны все новые и новые возможности, чтобы купаться 
в них, как в ванне с шампанским, получили в свое распоряжение С++. И все были 
счастливы. 


[50 С99 

Спустя десять лет С подвергся существенному пересмотру. Были добавлены 
средства для численных и научных расчетов, стандартный тип комплекс- 
ных чисел и некоторые подобия обобщенных функций, адаптирующихся 
к типу аргументов. Включены некоторые удобные средства С++, включая 
однострочные комментарии (впервые появившиеся в предшественнике С – 
языке ВСРІ.) и возможность объявлять переменные в заголовке цикла #0г. 
Упрощена работа со структурами – благодаря новым правилам объявления 
и инициализации и некоторым нотационным усовершенствованиям. При- 
знано, что безопасность – не последнее дело и что не все в мире говорят по- 
английски, и это тоже оказало влияние на модернизацию языка. 
Размышляя о том, сколько нового появилось в стандарте С89, и учитывая, 
что нет в мире компьютера, где бы не работал код на С, трудно представить, 
что ИСО мог придумать нечто такое, что не подверглось бы ожесточенной 
критике, – его ругали даже за отказ вносить те или иные изменения. И нель- 
зя не признать, что стандарт оказался противоречивым. Существует два об- 
щепринятых способа представить комплексное число (в прямоугольных и 
в полярных координатах) – так почему ИСО отдал предпочтение только од- 
ному? Зачем нужен механизм макросов с переменным числом аргументов, 
если код прекрасно можно писать и без него? Иными словами, блюстители 
чистоты идеи обвиняли ИСО в том, что тот уступил давлению со сторо- 
ны жаждущих новой функциональности. В настоящее время большинство 
компиляторов поддерживают С99 с некоторыми оговорками, например 
серьезные трудности вызывает тип 1опд йоџр1е. Однако есть одно заметное 
исключение из этого широкого консенсуса: корпорация Майкрософт отка- 
зывается включать поддержку С99 в свой компилятор \15иа| Зеи4ю С++. 
В разделе «Компиляция кода на С в \п4о\/5> ниже мы увидим некоторые 
из многочисленных способов откомпилировать код в УЛп4о\з, так что от- 
каз от Міѕиа! $1410 – не более чем неудобство, а желание крупного рыноч- 
ного игрока запретить нам использование стандартов А№І и 150 только 
укрепляет дух панк-рока, свойственный С. 


С11 

Сознавая справедливость обвинений в уступке давлению, ИСО внес серьез- 
ные изменения в третью редакцию стандарта. Стало возможно писать обоб- 
щенные функции, дальнейшее развитие получили также идеи безопасности 
и интернационализации. 

Стандарт С11 вышел в декабре 2011 года, но разработчики компиляторов 
на удивление быстро поддержали его. Сейчас большинство основных ком- 
пиляторов заявляет о почти полном соответствии. Однако стандарт опреде- 
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ляет поведение не только компилятора, но и стандартной библиотеки, а вот 
поддержка библиотеки и, в частности, многопоточности и атомарных опе- 
раций в одних системах реализована, а в других отстает. 


Стандарт РОЅІХ 


Выше было описано положение дел с самим языком С, однако он всегда развивал- 
ся вместе с операционной системой Чмх, и в книге вы увидите, что эта взаимо- 
связь существенна для повседневной работы. Если какая-то задача легко решается 
с помощью командной строки Опіх, то, скорее всего, она легко решается и на С; 


инструментальные средства Отих часто создаются, чтобы упростить кодирование 
на С. 


Опіх 

Си Опіх были разработаны в компании Ве! Г.аБ$ в начале 1970-х годов. На 
протяжении большей части ХХ столетия Ве| постоянно преследовалась за мо- 
нополистическую практику, и в одном из соглашений с правительством США 
компания пообещала не распространять свои коммерческие интересы на разра- 
ботку программного обеспечения. Таким образом, система Опіх была бесплатно 
отдана исследователям, которые получили право разбирать ее на части и со- 
бирать заново. Само слово Чшх является торговым наименованием, которое 
первоначально принадлежало Ве! Г.аБ$, а затем разошлось, как бейсбольная 
карточка, среди многочисленных компаний. 


Варианты Опіх плодились один за другим по мере изучения, переделки и улуч- 
шения кода независимыми энтузиастами. Достаточно было одной крохотной не- 
совместимости, чтобы сделать программу или скрипт непереносимыми, поэтому 
очень скоро была осознана необходимость какой-то стандартизации. 


РОЅІХ 

Этот стандарт, впервые выпущенный Институтом инженеров электротехни- 
ки и электроники (ІЕЕЕ) в 1988 году, заложил общую основу для всех Опіх- 
подобных операционных систем. В нем описывается, как должна работать обо- 
лочка, чего ожидать от командтипа 15 и дгер, атакже ряд библиотек, на которые 
имеют право рассчитывать программисты, пишущие на С. Например, именно 
здесь детально описан механизм конвейеров, с помощью которых сцепляются 
команды в оболочке; это означает, что библиотечная функция рореп (открыть 
конвейер) описана в стандарте РОЅІХ, а не 150 С. Стандарт РОЗ Х много раз 
пересматривался; на момент написания этой книги последней является версия 
РОЗХ:2008, и именно ее я имею в виду, говоря, что нечто совместимо с РОЅІХ. 
В системе, соответствующей стандарту РОЅІХ, должен присутствовать компи- 
лятор С, доступный по имени с99. 

В этой книге стандарт РОЅІХ используется, и я скажу об этом, когда дело до 
него дойдет. За исключением многочисленного семейства ОС от Майкрософт, 
практически все прочие операционные системы совместимы с РОЗХ: Глпих, 
Мас О Х, 105, меЬО5, $о]аг1з, Вр, даже в серверных ОС УЛп4о\з имеется 
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подсистема РОЅІХ. А о том, как установить подсистему РОЅІХ для систем, 
выбивающихся из общего ряда, написано в разделе «Компиляция кода на С 
в Міпаомѕ» ниже. 


Наконец, существуют еще две реализации РОЅІХ, о которых стоит упомянуть 


ввиду их широкой распространенности и влиятельности. 


Вѕр 

После того как компания Ве!] ГаБѕ отдала Отих на растерзание публике, ученые 
из Калифорнийского университета в Беркли внесли существенные усовершен- 
ствования и в конечном итоге полностью переписали код Ошх, в результате 
чего появился дистрибутив Вегкееу Зой\аге Ріѕігірийоп. Всякий, кто поль- 
зуется компьютером производства компании Арріе, работает с системой В$О, 
снабженной привлекательным графическим интерфейсом. В некоторых отно- 
шениях В$О выходит за рамки РОЅІХ, и мы увидим функции, которые в стан- 
дарт РОЅІХ не входят, но настолько полезны, что обойти их вниманием никак 
нельзя (и прежде всего такая палочка-выручалочка, как азрг1 п). 


СМИ 

Этот акроним расшифровывается как «СМИ 15 №оє Опіх», это еще один успеш- 
ный пример независимой реализации и улучшения окружения Чшх. В подав- 
ляющем большинстве дистрибутивов [іпих используются инструментальные 
средства СМО. Почти наверняка на вашем РОЅІХ -совместимом компьютере 
установлен набор компиляторов СМО Сотрііег Соесќіоп (5сс), даже в ВЅр 
он есть. Подчеркнем, что сс – это стандарт де-факто, который в некоторых на- 
правлениях расширяет С и РОЅІХ. Всюду, где эти расширения встречаются, 
я буду упоминать о них явно. 


С юридической точки зрения, лицензия В$О чуть более либеральна, чем лицен- 


зия СМО. Поскольку некоторые организации глубоко озабочены политическими 
и деловыми аспектами лицензий, большинство инструментов предлагается в ва- 
риантах для СМИ и для ВѕЅр. Например, как в бсс, так и в ВЅ5р имеется проект 
с1апд, включающий первоклассные компиляторы языка С. Разработчики из обоих 
лагерей пристально наблюдают друг за другом и перенимают достижения, поэто- 
му можно ожидать, что существующие на сегодня различия в будущем сойдут на 
нет. 


Юридические вопросы 


В законодательстве США больше нет системы регистрации прав на интеллектуальную 
собственность; за немногими исключениями, все, что кем-то написано, автоматически 
защищено таким правом. 

Разумеется, для распространения библиотеки необходимо копирование с одного 
жесткого диска на другой, и существует целый ряд общеупотребительных механизмов 
предоставления права копирования произведения, защищенного правом интеллек- 
туальной собственности, с минимумом формальностей. 

Лицензия СМИ Рис Шсепѕе разрешает копирование исходного кода и его исполняе- 
мого варианта без ограничений. Существует одно важное условие: если вы распростра- 
няете программу или библиотеку, в которой используется исходный код, защищенный 
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лицензией ОРІ, то обязаны распространять и исходный код своей программы. Следует 
понимать, что если вы используете программу только внутри организации и не распро- 
страняете ее, тоэтоусловие квам не относится, и включать в дистрибутив исходный код 
необязательно. Исполнение программ, распространяемых на условиях СРЕ, например 
компиляция своего кода с помощью дсс, не влечет обязательств по распространению 
своего исходного кода, потомучто результат работы программы (например, созданный 
компилятором исполняемый файл) не считается производным продуктом дсс. [При- 
мер: библиотека СМИ З‹епи#Яс Шбгагу.] 

Лицензия [е$5ег СРІ во многом аналогична ОРЕ, но при этом явно оговаривается, что 
если вы компонуете свою программу с разделяемой библиотекой, распространяемой 
на условиях СРЕ, то ваш код не считается производным продуктом, и потому распро- 
странять исходный код необязательно. Иначе говоря, разрешено распространять без 
исходного кода программу, скомпонованную с ЕСРЕ-библиотекой. [Пример: библиоте- 
ка @ЦЬ.] 

Лицензия В50 требует сохранения авторских прав и оговорок об ограничении ответ- 
ственности для распространяемого на условиях этой лицензии исходного кода, но не 
требует включения исходного кода в дистрибутив. [Пример: библиотека 6хт!2, рас- 
пространяемая по лицензии МІТ, аналогичной ВЅр.] 

Примите во внимание обычную оговорку: я не юрист, и это всего лишь краткое изло- 
жение довольно длинных юридических документов. Если вы не уверены относительно 
особенностей своего случая, прочитайте сам документ или обратитесь за консультаци- 
ей кюристу. 


Технические вопросы 
Второе издание 


Признаться, раньше я был немного циничен и полагал, что второе издание пишут, 
чтобы подгадить тем, кто собирается продать прочитанный экземпляр первого из- 
дания. Но это конкретное второе издание было бы невозможно без выхода перво- 
го и не могло бы выйти раньше (да и большинство читателей все равно читает 
электроиные версии). 

Самое крупное добавление, по сравнению с первым изданием, - глава о парал- 
лельных потоках, иначе говоря, о распараллеливании. Основное внимание в ней 
уделено библиотеке ОрепМР и атомарным переменным и структурам. ОрепМР не 
является частью стандарта С, но входит в экосистему С, и потому ее рассмотрение 
в этой книге вполне уместно. Атомарные переменные были добавлены в версию 
стапдарта, опубликованную в декабре 2011 года, с этого момента до выхода перво- 
го издания даже года не прошло, поэтому в то время ни один компилятор их не 
поддерживал. Но стех пор прогресс не стоял на месте, и я смог написать эту главу, 
опираясь как на изложенную в стандарте теорию, так и на реальный протестиро- 
ванный код (см. главу 12). 

Первое издание почтили вниманием некоторые исключительно педантичные 
читатели. Они заметили все огрехи, которые можно было истолковать как ошиб- 
ки, — от написанной мной глупости по поводу дефисов в командной строке до не- 
правильно построенных предложений. Ничто в мире не совершенно, но благодаря 
конструктивным отзывам читателей книга стала гораздо точнее и полезнее. 

Перечислю прочие дополнения к первому изданию. 
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О В приложении А приведен краткий справочник по языку С для читате- 


[З 


лей, имеющих опыт программирования на других языках. Мне не хотелось 
включать его в первое издание, потому что учебных пособий по С и так до- 
статочно, но, как выяснилось, с ним книга стала полезнее. 

Откликаясь на часто высказываемое пожелание, я существенно расширил 
материал по работе с отладчиком (см. раздел «Работа с отладчиком»). 

В первом издании был раздел о том, как писать функции с переменным чис- 
лом аргументов, так чтобы оба вызова ѕит(1, 2.2) и ѕит(1, 2.2, 3, 8, 16) были 
правильны. Ночто, если требуется передать несколько списков, например вы- 
числить скалярное произведение двух векторов произвольной длины: 901 ( (2, 
4), (-1, 1) ) идо ((2, 4, 8, 16), (-1, 1, -1, 1) ) (см. раздел «Несколько списков»)? 
Я переписал главу 11 о расширении объектов путем добавления новых 
функций. Основное дополнение – реализация виртуальных таблиц. 

Я немного дополнил материал о препроцессоре, уделив внимание трудному 
вопросу о тестовых макросах, включая и мимолетное упоминание ключево- 
го слова 5баіс аѕѕегі. 

Я остался верен данному самому себе обещанию не включать в эту книгу 
справочный материал по регулярным выражениям (потому что в сети и 
в других книгах в этом нет недостатка). Но все же добавил демопстраци- 
онный пример в разделе «Разбор регулярных выражений», посвященпом 
использованию определенных в РОЅІХ функций для работы с регулярны- 
ми выражениями, которые, по сравнению с другими языками, являются до- 
вольно низкоуровневыми. 

Обсуждение работы со строками в первом издании во многом опиралось на 
функцию аѕргіпі?, которая похожа на ѕргіпії, но автоматически выделяет 
необходимое количество памяти перед записью в нее строки. Существует 
версия этой функции в дистрибутиве СМО, но многие читатели не могут 
ей воспользоваться из-за условий лицензии, поэтому в примере 9.3 в этом 
издании я показал, как написать такую функцию, пользуясь только стан- 
дартными конструкциями С. 

Один из серьезных вопросов, обсуждаемых в главе 7, – тот факт, что де- 
тальное управление числовыми типами может приводить к проблемам, по- 
этому в первом издании я не упомянул о десятках новых числовых типов, 
появившихся в стандарте С99, например: іпі 1еаѕ32 Ё, џілі ѓаѕі64 сит. д. 
(С99 $7.18; С11 87.20). Несколько читателей настойчиво просили меня от- 
метить хотя бы наиболее полезные типы, например іпіріг ї и іпіпах +, что я 
и делаю в подходящем месте. 


Графические выделения 


В книге применяются следующие графические выделения: 


Курсив 
Новые термины, ОКІ -адреса, адреса электронной почты, имена и пути к фай- 
лам. Многие термины определены в глоссарии в конце книги. 
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Моноширинный 

Листинги программ, а также элементы кода в основном тексте: имена перемен- 
ных й функций, базы данных, типы данных, переменные окружения, предложе- 
ния и ключевые слова языка. 


Моноширинный курсив 
Текст, вместо которого следует подставить значения, заданные пользователем 
или определяемые контекстом. 
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Е) 
\ и Так обозначается совет, рекомендация или замечание общего характера. 


`` 
Так обозначаются упражнения, призванные помочь в освоении. 


Так обозначается предупреждение или предостережение. 


О примерах кода 


Эта книга призвана помогать вам в работе. Поэтому вы можете использовать при- 
веденный в ней код в собственных программах и в документации. Спрашивать 
у нас разрешение необязательно, если только вы не собираетесь воспроизводить 
значительную часть кода. Например, никто не возбраняет включить в свою про- 
грамму несколько фрагментов кода из книги. Однако для продажи или распро- 
странения примеров из книг издательства О’КеШу на компакт-диске разрешение 
требуется. Цитировать книгу и примеры в ответах на вопросы можно без ограни- 
чений. Но для включения значительных объемов кода в документацию по соб- 
ственному продукту нужно получить разрешение. 

Примеры кода можно скачать с сайта ћёёрѕ:/ /6їһиЬ.сот/Б-К/215(-Сепёигу- 
Ехатріеѕ. 

Мы высоко ценим, хотя и не требуем, ссылки на наши издания. В ссылке обыч- 
но указываются название книги, имя автора, издательство и 15В№, например: 
«215 Сепёџгу С Бу Веп КіІетепѕ (О’КеШу). Соругівһ 2013 Веп Кетепз, 978-1- 
449-32714-9». 

Если вы полагаете, что планируемое использование кода выходит за рамки из- 
ложенной выше лицензии, пожалуйста, обратитесь к нам по адресу регтіѕѕіопѕ@ 
огеШу.сот. 


Как с нами связаться 
Вопросы и замечания по поводу этой книги отправляйте в издательство: 


О’ВеШу Мейіа, Іпс. 

1005 Стауепѕѓеіп Нірһмау М№Могіһ 

ЅеБаѕѓороі, СА 95472 

800-998-9938 (в США и Канаде) 
707-829-0515 (международный или местный) 
707-829-0104 (факс) 
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Для этой книги имеется веб-страница, на которой публикуются списки заме- 
ченных ошибок, примеры и прочая дополнительная информация. Адрес страни- 
цы: һёёр:/ /огеії.1у /2156 сепёџгу с. 

Замечания и вопросы технического характера следует отправлять по адресу 
БооКкаиеѕііопѕ@огеШу.сот. 

Дополнительную информацию о наших книгах, конференциях и новостях вы 
можете найти на нашем сайте по адресу Вр: / /муу.огеШу.сот. 

Читайте нас на ЕасеБоокК: ћёёр:/ /ЁасеБооК.сот/огеШу. 

Следите за нашей лентой в Тміќег: Вр: / /уіёќег.сот /огеШутейіа. 

Смотрите нас на ҮоиТиБе: һр: / /ууу.уоииђБе.сот/огеШутейіа. 


Благодарности 

О Нора Альберт: общая поддержка, подопытный кролик. 

О Брюс Филдс, Дэйв Китабян, Сара Вейссман: скрупулезное рецензирова- 
ние. 

О Патрик Холл: знание Описоде. 

О Натан Джепсон, Эллисон Макдональд, Рейчел Румелиотис, Шон Уоллес: 
редактирование. 

О Андреас Клейн: указание на ценность типа 1пёрёг #. 

О Роландо Родригес: тестирование, любознательное использование, вдумчи- 
вое исследование. А 

О Рейчел Стили: производство. 

О Ульрик Свердруп: указание на то, как использовать позиционные инициа- 


лизаторы для задания значений по умолчанию. 


Часть 
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Окружение 


В дикой природе за пределами ухоженных садиков скриптовых языков в изоби- 
лии водятся инструменты, способные решить пугающие проблемы С, но на них 
придется поохотиться. Действительно придется: многие из них абсолютно необ- 
ходимы, если вы хотите писать код, не мучаясь. Если вы не пользуетесь отладчи- 
ком (автономным или в составе ШЕ), то взваливаете на себя совершенно ненуж- 
ные трудности. 

Существует также немало библиотек, которые только и ждут, чтобы вы вос- 
пользовались ими в своей программе и занимались решением поставленной за- 
дачи, не тратя времени на новую реализацию связанных списков, анализаторов и 
других вспомогательных средств. Компоновка программы с внешними библиоте- 
ками должна быть максимально простой. 

Ниже приводится обзор первой части. 

В главе 1 рассматривается настройка минимально необходимого окружения, 
в том числе использование менеджера пакетов для установки всех требуемых 
инструментов. Это подготовка к содержательной части – компиляции и компо- 
новке своих программ со сторонними библиотеками. Сам процесс хорошо стан- 
дартизирован и предполагает использование немногих переменных окружения и 
рецептов. 

В главе 2 мы познакомимся с инструментами для отладки, документирования 
и тестирования, потому что нельзя же назвать хорошим код, который не отлажеи, 
не документирован и не протестирован! 

Глава 3 посвящена Аџѓосоо!ѕ – системе создания пакета для распространения 
программы. Но этим мы не ограничимся, а рассмотрим также написание скриптов 
оболочки и файлов таКеШе. 

Ничтотак не осложняет жизнь, как другие люди. Поэтому в главе 4 мы рассмот- 
рим СЁ – систему учета слегка различающихся версий проекта на вашем диске и 
на дисках ваших коллег, которая елико возможно упрощает объединение версий. 

Неотъемлемой частью современного окружения С являются другие языки, по- 
тому что у многих из них имеется программный интерфейс к С. В главе 5 будут 
приведены общие замечания касательно использования такого интерфейса с раз- 
вернутым примером для языка Руфоп. 
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Настраиваем срелу 
ДЛЯ КОМПИЛЯЦИИ 


Гляди, милочка, как я пользуюсь техникой. 


— Игги Поп «Ѕеагсћ апа Ос$гоу» 


Одной лишь стандартной библиотеки С недостаточно для серьезной работы. 

Поэтому экосистема С вышла за рамки стандарта, а это значит, что если вы 

собираетесь решать задачи посложнее упражнений в учебниках, то необходимо 
знать, как вызывать функции из распространенных, но не описанных в стандар- 
те 1850 библиотек. Чтобы работать с ХМГ-документом, ЈРЕС-изображением или 
с ТТЕЕ-файлом, нужны соответственно библиотеки ПЬхт|, ПЫреё или ПИН. Все 
они свободно доступны, но частью стандарта не являются. Увы, на этом месте 
большинство учебников ставят многоточие и предоставляют вам искать выход са- 
мостоятельно, именно поэтому от хулителей С можно услышать такое внутренне 
противоречивое высказывание: «С уже 40 лет, поэтому на нем нужно все писать 
с нуля». Да они просто так и не дали себе труда понять, как компоновать програм- 
му с библиотеками. 

Вот план этой главы. 

О Настроить необходимые инструменты. Сейчасэто гораздо проще, чем в ста- 
родавние времена, когда приходилось охотиться за каждым компонентом. 
Подготовить полную систему сборки со всеми бантиками можно за 10, от 
силы 15 минут (плюс время скачивания всего добра). 

О Как компилировать программу на С. Понимаю, вы знаете, как это делается, 
но нам нужна конфигурация, к которой можно подключить библиотеки и 
указать, где их искать; одна лишь команда сс пуе.с мало что даст. Ма!е — 
пожалуй, простейшая система компиляции программ, поэтому при обсуж- 
дении мы возьмем ее за образец. Я покажу минимальный такеше, в котором 
вполне достаточно места для развития. 

О Любая используемая нами система опирается на несколько переменных 
окружения, поэтому мы поговорим о том, для чего они нужны и как зада- 
ются. После того как вся инфраструктура компиляции подготовлена, до- 
бавление новых библиотек сводится просто к изменению уже имеющихся 
переменных. 
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О В качестве бонуса мы воспользуемся всем проделанным к этому моменту, 
чтобы настроить еще более простую систему компиляции, которая позво- 
ляет копировать код прямо в командную строку. 

Отдельное замечание для работающих с ШЕ: пусть даже вы не имеете дела 

с таке, но эта глава для вас небесполезна, потому что каждому рецепту, который 
исполняет таке при компиляции программы, соответствует аналогичный рецепт 
в ШЕ. Если вы знаете, что делает таке, то сможете без труда настроить параметры 
своей ШЕ. 


Работа с менелжером пакетов 


Не пользуясь менеджером пакетов, вы много теряете. 

Я завел разговор о менеджерах пакетов по нескольким причинам. Во-первых, не 
исключено, что у кого-то не установлены даже базовые средства. Для них я вклю- 
чил этот раздел, поскольку эти инструменты необходимы, и как можно скорее. 
Хороший менеджер пакетов позволит очень быстро установить полную подсисте- 
му РОЅІХ, компиляторы для всех языков, о которых вы слышали и не слышали, 
вполне достойный набор игр, обычные средства повышения продуктивности тру- 
да, несколько сотен написанных на С библиотек и т. д. 

Во-вторых, для программистов на С менеджер пакетов – это тот важнейший 
компонент, с помощью которого мы получаем необходимые для работы библио- 
теки. 

В-третьих, если вам доведется перейти из категории скачивающих пакеты в ка- 
тегорию создателей пакетов, то эта книга доведет вас до середины пути - научит, 
как подготовить пакет для автоматической установки. Впоследствии, если адми- 
нистратор репозитория пакетов захочет включить ваш код в репозиторий, у него 
не будет сложностей с построением окончательного пакета. 

Если вы работаете в Глпих, то менеджер пакетов уже использовался на стадии 
конфигурирования компьютера, поэтому вы видели, сколь простым может быть 
процесс получения программного обеспечения. А для пользователей УЛп4о\з я 
подробно рассмотрю систему Сурміп. У пользователей Мас есть несколько вари- 
антов, например ЕшК и Масрог($. Все они опираются на предлагаемую Арріе си- 
стему Хсо4е, которая доступна бесплатно на установочном диске ОС, в каталоге 
допускающих установку программ, в магазине Арр Ѕќоге или с помощью регистра- 
ции в качестве разработчика Арріе (в зависимости от даты выпуска вашего Мас’а). 

Какие пакеты вам понадобятся? Ниже приведен краткий ликбез по основам 
разработки на С. Разные системы организованы по-разному: состав дистрибути- 
вов разнится, по умолчанию устанавливается то одно, то другое, иногда пакеты 
имеют странные имена. Если сомневаетесь относительно какого-то пакета, ставьте 
его, потому что прошли те дни, когда установка лишнего могла вызвать замедле- 
ние или нестабильную работу системы. Однако вам может не хватить скорости 
сети (а то и места на диске), чтобы установить все имеющиеся в мире пакеты, по- 
этому нужно все же себя ограничивать. Если окажется, что вы о чем-то забыли, 
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всегда можно будет доставить пакет позже. Пакеты, которые совершенно точно 
необходимы: 


оооооооо 


Компилятор. Обязательно установите бсс, возможно, имеется также СІапе. 

ББ, отладчик. 

Уаіргіпӣ, для проверки наличия ошибок работы с памятью. 

Ерго, профилировщик. 

таке, чтобы не вызывать компилятор напрямую. 

рке-сопіє, для поиска библиотек. 

Рохувеп, для генерации документации. 

Текстовый редактор. Их сотни, выбирать есть из чего. Приведу несколько 

субъективных рекомендаций: 

— Етасѕ и уіт любят крутые спецы. Етасѕ умеет все (буква Е означает 
ехіепѕіЫе — расширяемый), у уіт возможностей поменьше, зато он очень 
удобен для тех, кто печатает вслепую. Если вы предчувствуете, что на ра- 
боту с редактором придется потратить сотни часов, то имеет смысл осво- 
ить хотя бы один из этой парочки. 

— Кае – дружелюбный и симпатичный, предлагает неплохой набор функ- 
ций, полезных программистам, например подсветку синтаксиса. 

— На крайний случай попробуйте папо – простой, как правда, редактор 
с текстовым интерфейсом, который, следовательно, работает даже тогда, 
когда графического интерфейса нет. 

Если вы поклонник ШЕ, выберите какую-нибудь одну – или несколько. 

Здесь выбор также велик, дам несколько советов. 

— Апјиќа: входит в семейство СМОМЕ. Дружит с СІайе, конструктором гра- 

фических интерфейсов СМОМЕ. 

КОеуеор: входит в семейство КРЕ. 

— Сойе:ЫосКѕ: относительно простая среда, работает в Міпӣоуѕ. 

— Есјірѕе: автомобиль представительского класса, с кучей подставок для ча- 
шек и дополнительных кнопочек. Кстати, кросс-платформенный. 


В последующих главах я расскажу и об инструментах для более тяжелых работ: 


Ө! 
Ө! 
о 


АиќосооЇ: Аибосоп#, Ашотаке, 115001; 
Сі; 
альтернативные оболочки, в том числе 251. 


Ну и, разумеется, написанные на С библиотеки, которые избавят вас от псобхо- 
димости изобретать колесо (или, если употребить более точную метафору, паро- 


воз). 


Возможно, вам понадобится многое другое, но ниже перечислены библиоте- 


ки, которые используются в этой книге: 


о 


Ө! 
о 
о 
Ө! 


ШЬсОв1; 
ПЬСИЬ; 
ПЬС$Г; 
ПЬ$ОГке3; 
ЬХМ12. 


По поводу именования библиотечных пакетов нет единодушия, и вам придется 
самостоятельно разбираться в том, как менеджер пакетов предпочитает разбивать 
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единую библиотеку на части. Как правило, существует один пакет для пользова- 
телей и другой для разработчиков, которые собираются использовать библиотеку 
всвоих проектах, поэтому ставьте как базовый пакет, так и пакет с именем, оканчи- 
вающимся на -деу или -деуе]. В некоторых системах документация поставляется 
в виде отдельного пакета. А бывает так, что отладочные символы нужно скачивать 
отдельно – тогда при первой попытке отладить код, для которого нет отладочных 
символов, 24Ь подскажет, что сделать. 

Если вы работаете в РОЅІХ-системе, то после установки всего вышеперечис- 
ленного получите полную систему разработки и сможете приступить к кодирова- 
нию. Для пользователей Міпаомѕ мы сделаем небольшое отступление, в котором 
объясним, как процедура установки взаимодействует с операционной системой. 


Компиляция программ на С в МЛпаомѕ 


В большинстве систем С - это центральный, «привилегированный» язык, при- 
хотям которого служат все прочие инструменты; в Міпӣомѕ С почему-то оказался 
в загоне. Поэтому я потрачу немного времени, чтобы объяснить, как обустроить 
машину под управлением УЛп4до\з для программирования на С. Если вы в дан- 
ный отрезок времени не пишете в Міпіомѕ, то переходите сразу к разделу «Как 
пройти в библиотеку?». 


РОЅІХ в Міпаомѕ 


Поскольку С и Опіх развивались параллельно, трудно говорить об одном и не го- 
ворить о другом. Полагаю, проще всего начать со стандарта РОЅІХ. К тому же про- 
граммистам, пытающимся откомпилировать в Міпӣомѕ код, написанный в какой- 
то другой системе, этот путь покажется самым естественным. 

Насколько мне известно, все, что так или иначе связано с файловыми система- 
ми, можно разбить на два слабо перекрывающихся класса: 

О РОЅІХ-совместимые системы; 

О семейство операционных систем Міпіомѕ. 

Совместимость с РОЅІХ не означает, что система должна выглядеть и работать, 
как Ошх. Например, типичный пользователь Мас понятия не имеет, что использу- 
ет стандартную систему Вѕр с красивым фасадом, но знающие люди могут перей- 
ти в папку Ассеѕѕогіеѕ  О1ійеѕ, открыть программу Тегтіпа! и выполнять милые 
их душе команды 15, дгер или паке. 

И, кстати говоря, я сомневаюсь, что много найдется систем, на все 100% отве- 
чающих требованиям стандарта (например, о наличии компилятора Еогїгар 77). 
Для наших целей достаточно РОЅІХ-оболочки, дюжины утилит (зе4, дгер, паке, 
...), компилятора С99 и дополнений к стандартной библиотеке С, в частности Ёогк 
и ісопу. Их можно доустановить в качестве довеска к основной системе. Менеджер 
пакетов, внутренние скрипты, Ацёо{юо[ и почти все прочие средства для написа- 
ния переносимого кода в той или иной степени опираются на эти инструменты, 
так что даже если вы и не собираетесь глазеть весь день на командную строку, 
установить их было бы полезно. 
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В серверных ОС и полных изданиях УЛ п4до\з 7 Майкрософт предлагает то, 
что раньше называлось ІЧТЕКІХ, а теперь «подсистема для приложений на базе 
Опіх» (50А). Она включает стандартные системные вызовы РОЗ[Х, оболочку 
Корна и компилятор 5сс. По умолчанию эта подсистема обычно не устанавлива- 
ется, но может быть установлена в качестве дополнительного компонента. Однако 
для других современных изданий \У/Лп4о\/з 80А недоступна, нет ее и в Міпӣомѕ 8, 
поэтому нельзя предполагать наличие подсистемы РОЗХ во всех операционных 
системах Майкрософт. 

А раз так, то переходим к Сувміп. 

Если бы нужно было создать Сувміп с нуля, то следовало бы действовать по 
такому плану. 

1. Написать на С библиотеку для УЛт4о\з, которая предоставляет все функ- 
ции РОЅІХ. Она должна будет сгладить несоответствия между УМ п4о\$ и 
РОЅІХ, например тот факт, что в Міпіомѕ диски обозначаются буквами 
(С), ав РОЅІХ файловая система однородна. В данном случае диск С: по- 
лучает псевдоним /суратие/Сс, диск Р: – псевдоним /сурапие/4 и т. д. 

2. Теперь, когда мы можем откомпилировать любую РОЗ[Х-совместимую про- 
грамму, скомпоновав ее с нашей библиотекой, нужно построить Міпіомѕ- 
версии программ 15, раѕћ, дгер, паке, дсс, Х, гхуї, 115911, рег1, ру Пол и т. д. 

3. Построив сотни программ и библиотек, нужно настроить менеджер пакетов, 
который позволял бы пользователям выбирать, что устанавливать. 

Пользователю Суё\ут нужно всего лишь скачать менеджер пакетов по ссылке 
на программу установки на сайте Сур\/т по адресу /ќѓр;//суроіп.сот и выбрать 
нужные пакеты. Безусловно, вам понадобится все вышеперечисленное, а также 
приличный терминал (попробуйте шш(у или установите подсистему Х и поль- 
зуйтесь жегт, то и другое куда лучше стандартной программы сп4.ехе, включен- 
ной в Міпӣомѕ), но вообще-то, как вы увидите, к вашим услугам практически 
все богатство системы разработки. Вот теперь можно приступать к компиляции 
кода. 


Компиляция программ на С при наличии подсистемы РОЅІХ 


Майкрософт поставляет компилятор С++, входящий в состав \У15иа| Ѕіџаіо, 
а у него есть режим совместимости с С89 (обычно он называется АМ5Г С, хотя 
в настоящее время стандартом АМЗ] является С11). И это единственное средство 
компиляции программ на С, предлагаемое Майкрософт. Представители компании 
ясно дали понять, что ожидать чего-нибудь, кроме поддержки нескольких воз- 
можностей, описанных в С99 (не говоря уже о поддержке С11), не следует. Уіѕиа! 
Зи – единственный из основных компиляторов, так и застрявший на С89, по- 
этому придется искать альтернативы в других местах. 

Разумеется, в Сурміп есть сс, так что если вы, следуя моим указаниям, устано- 
вили Сурміп, то все окружение сборки уже готово. 

По умолчанию программы, скомпилированные в среде Сурміп, зависят от биб- 
лиотеки функций РОЅІХ сувилт1.АИ (даже если программа нигде не обращается 
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к функциям РОЅІХ). Если запустить программу на машине, где Сувміп установ- 
лена, то проблем не возникнет. Щелчок по исполняемому файлу приведет к его 
запуску, поскольку система найдет ОІ І -библиотеку Суё\т. Программы, скомпи- 
лированные в среде Сурміп, можно запускать и на машине, где Суё\у/п не стоит, 
нужно только включить в дистрибутив файл сурилт1.аЙ. На моей машине он нахо- 
дится в каталоге (путь к суріп) /іп/сувоіп1.ӣ1. Файл сувит1.АЙ поставляется на 
условиях СРГ-подобной лицензии (см. врезку «Юридические вопросы» выше), 
то естьесли вы распространяете его отдельно от Сувміп, то обязаны опубликовать 
исходный код своей программы!. 

Если это оказывается проблемой, то вам придется найти способ переписать 
программу, так чтобы она не зависела от сувит1.аЙ, а это означает, что нужно от- 
казаться от всех специфичных для РОЅІХ функций (например, ѓогк или рореп) и 
использовать комплект МіпСМ, как описано ниже. С помощью утилиты судсћеск 
можно узнать, от каких ЮІ 1. зависит ваша программа, и таким образом проверить, 
компонуется ваш исполняемый файл с суріп. или нет. 

( ‚ Узнать, от каких еще библиотек зависит данная динамическая библиотека, можно следую- 
/ щим образом: 
• Судміп: судсћеск 110хх.а11 


• пих: 194 1ірхх.ѕо 
• Мас: осоо] -1 1ірхх.ӣу11р 


Компиляция программ на С в отсутствие подсистемы РОЅІХ 


Если вашей программе не нужны функции РОЅІХ, то можно воспользоваться 
комплектом Ма С\У/ (Міпітаііѕё СМО ѓог Міпӣомѕ), в котором есть стандартный 
компилятор С и несколько простых инструментов. Дополнением к МСУ слу- 
жит комплект М$У5, содержащий оболочку и другие полезные утилиты. 

Вы можете пользоваться РОЅІХ -оболочкой, входящей в состав МЅҮЅ (там же 
найдется терминал тіпёќу или КХУТ, в котором эта оболочка будет исполнять- 
ся), или вообще отказаться от командной строки и попробовать интегрированную 
среду Со4е::ЫоскК$, в которой МтСУ/ применяется для компиляции в УЛп4о\5. 
Есјірѕе – гораздо более развитая ШЕ, которую тоже можно настроить под МтСУ,, 
хотя это требует немного больше работы. 

Если же вам приятнее работать с командной оболочкой РОЗ[Х, настройте 
Суё\/, установите пакеты, содержащие версию бсс из комплекта МіпСМ, и поль- 
зуйтесь этим компилятором, а не включенной в Сувміп по умолчанию версией 
Есс, которая компонует вашу программу с библиотекой РОЅІХ. 

Если вы раньше не сталкивались с Аиѓоѓоо!ѕ, то встречи осталось ждать недолго. 
Признаком пакета, построенного с помощью АиќоѓооЇѕ, является процедура уста- 
новки, состоящая из трех шагов: . /сопйдиге && паке && паке іпѕїа11. МЅҮЅ предостав- 
ляет все необходимое, чтобы такие пакеты заработали (с большой вероятностью). 


' Проект Сурміп сопровождает компания Кей Наг, [пс., которая дает возможность купить 
право пе распространять исходный код, как того требует СРІ. 
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Ну а если вы скачали пакеты из командной строки Суё\/ш и хотите собрать их 
самостоятельно, то для того чтобы при сборке пакета использовался компилятор 
Міпр№32, порождающий независимый от РОЅІХ код, нужно следующим образом 
модифицировать первый шаг: 


„.’сопйаиге --Һоѕё=тіпд32 


Затем выполните паке; таке іпѕіа11, как обычно. 

Результатом компиляции пакета с помощью МтСУ,, все равно, из командной 
строки или средствами Аибоюо(5, является машинный код для УЛп4о\уз. Посколь- 
ку МтСУ ничего не знает о сувилт1.АЦ, а ваша программа к функциям РОЅІХ не 
обращается, то получится честная Міпӣомѕ-программа, и никто не сможет ска- 
зать, что она была откомпилирована в окружении РОЗХ. 

Однако в настоящее время для МтСУ/ очень мало готовых откомпилирован- 
ных библиотек'. Если вы хотите освободиться от сурит1.аЙ, то не сможете вос- 
пользоваться версией /16216.АЦ, которая идет с Сурміп. Вам придется перекомпи- 
лировать СТ1Ь из исходных текстов в нормальную У/Лт4о\з ОГ, однако СТА 
зависит от библиотеки рецехк, разработанной СМО для интернационализации, 
поэтому сначала придется собрать ее. Современный код зависит от множества 
библиотек, поэтому вы, скорее всего, потратите уйму времени на действия, кото- 
рые в других системах требуют всего одного обращения к менеджеру пакстов. Вот 
мы и вернулись к тому положению вещей, которое заставляет говорить о том, что 
С, мол, уже 40 лет, поэтому все нужно писать с нуля. 

Так что подводные камни есть. Майкрософт ушла от разговора, оставив другим 
реализовывать постпанковский компилятор С и окружение для него. Сувміп при- 
няла вызов и предоставляет полный менеджер пакетов с достаточным набором 
библиотек, который позволяет вам решить поставленную задачу целиком или 
хотя бы частично. Однако этот набор опирается на стандарт РОЅІХ и библиотеку 
Суё\мп. Если это оказывается проблемой, то для создания окружения и сборки 
необходимых библиотек вам придется проделать дополнительную работу. 


Как пройти в библиотеку? 


Итак, у вас есть компилятор, комплект инструментов, определенный в стандарте 
РОЗХ, и менеджер пакетов, позволяющий установить сотни библиотек. Теперь 
займемся вопросом о том, как воспользоваться этими библиотеками при компи- 
ляции своей программы. 


' Хотя в комплекте МтСУ/ ссть менеджер пакетов, который устанавливаст основные 


средства системы и предлагает кое-какие библиотеки (большая их часть нужна самому 
МіпСҰ), эта кучка заранее откомпилированных библиотек – ничто по сравиению с сот- 
нями пакетов, предлагаемых типичным менеджером пакетов. На самом деле менеджер 
пакетов на моей Гіпих-машине предлагает даже больше библиотек, откомпилироваиных 
для МіпСМ, чем менеджер пакетов из МтСУХУ. Но это на момент написапия кпиги; не 
исключено, что когда вы будете се читать, такие же энтузиасты, как вы сами, положат 
в репозиторий МтСУ\ дополнительные пакеты. 
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Начать нужно с вызова компилятора из командной строки, а соответствующая 
команда очень быстро становится несуразно длинной. Однако есть три (иногда 
три с половиной) простых шага, облегчающих жизнь. 

1. Задать переменную, содержащую флаги компилятора. 

2. Задать переменную, содержащую список библиотек, с которыми компону- 
ется программа. Половина шага связана с тем, что иногда нужно задавать 
одну переменную для компоновки на этапе компиляции, а иногда две — для 
компоновки на этапе компиляции и на этапе выполнения. 

3. Настроить систему, так чтобы эти переменные учитывались при компиляции. 

Чтобы воспользоваться библиотекой, необходимо дважды сообщить, что вы 
собираетесь импортировать из нее функции: один раз – компилятору, второй — 
компоновщику. Если библиотека находится в стандартном месте, то первое объ- 
явление производится с помощью директивы #1пс114е в тексте программы, а вто- 
рое – с помощью флага -1 при вызове компилятора. 

В примере 1.1 показана простая программа, которая выполняет интересное 
математическое вычисление (по крайней мере, интересное для меня; если для 
вас статистическая терминология — абракадабра, ничего страшного). Описан- 
ная в стандарте С99 функция ошибок, ег{ (х), тесно связана с интегралом от 0 до х 
функции нормального распределения со средним 0 и стандартным отклонением 
\2. В данном случае мы используем функцию егЕ, чтобы вычислить площадь попу- 
лярной у статистиков области (95-процентный доверительный интервал для кри- 
терия проверки гипотезы о нормальном распределении). Назовем этот файл ег/.с. 


Пример 1.1 * Однострочная программа с вызовом функции из стандартной 
библиотеки (ег.с) 


#1пс14е <таёһћ.һ> //егЁ, заге 
#іпс1џае <ѕбаіо.һ> //рг1пЕЁЕ 


106 ма1л () { 
ргіпёё ("Тһе іпбедга1 оЁ а М№огта1 (0, 1) аіѕёгірибіоп " 
"ресмееп -1.96 апа 1.96 із: %9\п", егЁ(1.96*заге (1/2.))); 


Директивы #іпс10де должны быть вам знакомы. Компилятор вставляет вместо 
них содержимое файлов таѓл.ћ и 5 о.й соответственно, а следовательно, и объ- 
явления функций ре1 п, егЁ и здгі. Объявление в таѓћ.ћ ничего не говорит о том, 
что делает функция егў, известно лишь, что она принимает параметр типа іоџђ]е и 
возвращает значение типа йоиђ/е. Этой информации компилятору достаточно для 
проверки правильности использования и создания объектного файла, в котором 
оставлено сообщение компьютеру: когда дойдешь до этого места, найди функцию 
егЁ и подставь сюда возвращаемое ей значение. 

Отреагировать на это сообщение должен компоновщик, который и производит 
поиск функции ег в библиотеке, находящейся где-то на диске. 

Математические функции, объявленные в заголовке паїћ.ћ, живут в отдельной 
библиотеке, и компоновщику необходимо сказать об этом с помощью флага -1п. 
Здесь -1 означает, что необходимо прикомпоновать библиотеку, имя которой в дан- 
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ном случае состоит всего из одной буквы п. Функцию ргіпё# мы получаем задаром, 
потому что при вызове компилятора неявно подразумевается, что в самом конце 
команды указан флаг -1с, требующий от компоновщика добавить стандартную биб- 
лиотеку 1ірс. Позже мы увидим, что библиотека СІЛЬ 2.0 компонуется с помощью 
флага -19116-2.0, библиотека СМО Заепийс ГаЬгагу – с помощью флага -193]1 ит. д. 

Таким образом, если файл называется егў.с, то полная команда вызова компи- 
лятора 5сс с несколькими дополнительными флагами, которые мы обсудим ниже, 
выглядит так: 


дсс егЁ.с -о егё -1м -9 -Ма11 -03 -$&4=9пи11 


Итак, с помощью директивы #1пс11де в тексте программы мы попросили ком- 
пилятор включить математические функции, а с помощью флага -]п в командной 
строке попросили компоновщик прикомпоновать математическую библиотеку. 

Флаг -о задает имя выходного файла, без него мы по умолчанию получили бы 
исполняемый файл с именем а.оџќ. 


Несколько моих любимых флагов 


Как вы скоро увидите, я всегда указываю несколько флагов компилятора и вам 
советую поступать так же. 

О -9 – включить отладочные символы. Без этого флага отладчик не покажет 
вам имена переменных и функций. Наличие отладочных символов не за- 
медляет работу программы, а то, что файл станет на килобайт больше, не- 
существенно, поэтому нет никаких причин не пользоваться ими. Этот флаг 
понимают рсс, С1апр и ісс (Пе! С Сотр!ег). 

О -5{9=91и11 – этот флаг понимают «апр и рсс, он означает, что компилятор 
должен разрешать код, совместимый со стандартами С11 и РОЅІХ (а также 
некоторые расширения СМП). На момент написания данной книги сЇапе по 
умолчанию подразумевает стандарт С99, а сс — стандарт С89. Если у вас 
стоит версия 5сс, с1ап8 или ісс, предшествующая выходу стандарта С11, за- 
давайте флаг -$19=91199, чтобы работать на уровне С99. Стандарт РОЅІХ 
требует, чтобы в системе присутствовал компилятор с99, поэтому не содер- 
жащая версии стандарта командная строка для компиляции кода, совмести- 
мого с С99, имеет вид: 


с99 егЁ.с -о егЁ -1м -9 -Ма11 -03 


В показанных ниже файлах такее я достигаю того же эффекта, установив 
переменную СС=с99. 

/А В зависимости от года выпуска Мас с99 может быть специально подправленной версией 

/ | \ 9сс, а это, возможно, нето, что вам нужно. Если ваша версия с99 падает при задании флага 


-На11 или такой программы вообще нет, сделайте свою собственную версию. В файл ини- 
циализации оболочки (скорее всего, .баѕћгс) добавьте псевдоним 


а11аз с99="асс --50а=с99" 
или 

а11аз с99="с1апд" 

каквам больше нравится. 
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-03 – задает уровень оптимизации 3, при котором компилятор делает все 
возможное для построения более быстрого кода. Если при работе с отлад- 
чиком оказывается, что из-за оптимизации исчезло слишком много пере- 
менных и стало трудно следить за тем, что происходит, то задайте флаг -00. 
Ниже мы увидим стандартный способ сделать это с помощью переменной 
СЕІАС5. Флаг понимают ресс, СІапр и ісс. 

-йа11 – выводить все предупреждения компилятора. Годится для 5сс, СІапе 
и ісс. В случае ісс предпочтительнее флаг -н1, который задает режим вывода 
предупреждений компилятора, опуская замечания. 


Всегда включайте вывод предупреждений. Даже если вы думаете, что знаете стандарт С 
вдоль и поперек, компилятор все равно знает лучше. В старых учебниках С целые страницы 
заполнены наставлениями не путать = и == и проверять, что каждая переменная инициализи- 
руется перед использованием. Будучи автором более современного учебника, я поступлю 
проще, сведя все наставления к одному: обязательно включайте предупреждения компиля- 
тора. Если компилятор рекомендует что-то изменить, не спорьте с ним и не откладывайте 
исправление на потом. Сделайте все, чтобы (1) понять, с чем связано предупреждение, и 
(2) исправить код, так чтобы он компилировался вообще без ошибок и предупреждений. 
Невразумительность сообщений компилятора давно стала притчей во языцех, поэтому если 
с пунктом (1) возникают сложности, скопируйте текст предупреждения в поисковик – вы уз- 
наете, сколько народу до вас зашло в тупик, столкнувшись с ним. Возможно, вы захотите 
задать флаг -Неггог, чтобы компилятор трактовал все предупреждения как ошибки. 


Пути 
На моем диске больше 700 000 файлов, из которых один содержит объявления 
функций $9її и егї, а другой – объектный код откомпилированных функций. 
(Чтобы получить грубую оценку количества файлов в РОЗ[Х-совместимой си- 
стеме, выполните команду Йпа / -ёуре Ё | мс -1.) Компилятор должен знать, в каких 
каталогах искать заголовки и объектные файлы, и эта проблема еще осложняется, 
когда мы пользуемся библиотеками, не описанными в стандарте С. 

В типичной системе библиотеки могут находиться, по крайней мере, в трех ме- 


стах. 


е; 


е 


о 


Поставщик операционной системы определяет один или два стандартных 
каталога, где находятся поставляемые им библиотеки. 

Может существовать каталог, в который системный администратор уста- 
навливает пакеты, которые не должны быть перезаписаны при очередном 
обновлении ОС поставщиком. Там же могут находиться специальные вер- 
сии библиотек, подправленные администратором. 

У обычных пользователей обычно нет прав для записи в эти места, поэтому 
должна быть возможность использовать библиотеки, находящиеся в их до- 
машних каталогах. 


Что касается стандартных мест, то тут обычно проблем не возникает, компиля- 
тор знает, где искать стандартную библиотеку С и все установленное вместе с ней. 
В стандарте РОЅІХ такие каталоги называются «обычными местами». 

Но про все остальное компилятору нужно сказать явно. И тут мы сталкиваемся 
с византийским вероломством: нет никакого стандартного способа поиска библио- 
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тек в нестандартных местах, и эта неприятность занимает высокое место в списке 
вещей, вызывающих раздражение при работе с С. Но есть и хорошие новости: раз 
компилятор знает, где находятся обычные места, то распространители библиотек 
стараются ставить их именно туда, чтобы пользователям не приходилось задавать 
путь вручную. Еще одна хорошая новость заключается в том, что есть несколь- 
ко инструментов, помогающих в задании путей. И последнее приятное известие: 
один раз поняв, где расположены нестандартные места, вы можете прописать их 
в переменной оболочки или таКе@е и больше об этом не думать. 

Предположим, что на вашем компьютере имеется библиотека Глизе! и вы 
знаете, что различные относящиеся к ней файлы помещены в каталог //и7;/оса//, 
который официально предназначен для локальных библиотек, устанавливаемых 
администратором. Вы уже включили в код директиву #1пс114е <иѕеЁџ1.һ>, и теперь 
нужно следующим образом сформировать командную строку: 


9сс -І/иѕг/1оса1/іпс1џӣе иѕе џѕеЁџ1.с -о изе_изеЁи1 -1/иѕг/1оса1/11ір -10ѕеЁџ1 


Здесь: 

О Флаг -І добавляет путь в список каталогов, где компилятор ищет файлы, 
включаемые с помощью директивы #іпсІоде. 

О Флаг -1 добавляет путь в список каталогов, где ищутся библиотеки. 

О Порядок важен. Если файл ѕресі/іс.о зависит от библиотеки І1ЬЬгоаа, а биб- 
лиотека Г.1ЬБгоа4 зависит от [1Ьрепега|, то перечислять их нужно в следую- 
щем порядке: 


дсс зрес1Нс.о -1Ьгоаа -1депега1 


При любом другом порядке, например дсс -1ргоай -1депега1 зрес1йс.о, ком- 
поновка, скорее всего, завершится неудачно. Можете представлять этот 
процесс следующим образом: компоновщик сначала видит первый файл, 
зрес1йс.о, и составляет список неразрешенных ссылок на функции, структу- 
ры и имена переменных. Затем он переходит к указанной далее библиотске, 
-1ргоай, и ищет в ней недостающие элементы, попутно добавляя в список 
новые неразрешенные ссылки. Наконец, элементы, оказавшиеся в списке 
отсутствующих, ищутся в библиотеке -1депега1. Если по завершении этого 
процесса (не забудем о неявно добавляемой в конце библиотеке -1с) какие- 
то имена остались неразрешенными, то компоновщик завершает работу и 
выводит эти имена на экран. 

Но вернемся к проблеме местонахождения: где та библиотека, с которой вы хо- 
тите скомпоновать программу? Если она была установлена тем самым менедже- 
ром пакетов, который использовался для установки всей системы, то, скорее всего, 
находится в одном из обычных мест и беспокоиться не о чем. 

Возможно, вы представляете, где могут находиться локальные библиотеки, на- 
пример в каталогах /изт/юса[, /5 или /орі. Разумеется, к вашим услугам различ- 
ные средства поиска на диске, в частности определенная в РОЅІХ утилита іта. Так, 
команда 


бпа /изг -пате '1іроѕеЁџ1*! 
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ищет в каталоге /и57 файлы с именами, начинающимися с ПБизе Ш. Если разде- 
ляемый объектный файл библиотеки Г1Бизе Ш] найден в каталоге /ѕоте/раЁћ//:Ь, то 
ее заголовки почти наверняка находятся в каталоге /ѕоте/раёћ/іпсіийе. 

Но охота за библиотеками по всему диску мало кому нравится, поэтому утилита 
рка-сопйд решает эту проблему, сохраняя в репозитории флаги и места, которые 
сами пакеты объявляют необходимыми для компиляции. Наберите в командной 
строке ркд-сопйд; если появится сообщение с просьбой задать имена пакетов, зна- 
чит, все нормально: у вас есть ркд-сопй9, и ей можно воспользоваться для изыска- 
ний. Например, на моей машине следующие две команды: 


рк9-сопіід --115$ 951 1ірхт1-2.0 
рко-сопіід --сЙад$ 951 11рхт1-2.0 


печатают соответственно: 


-1951 -1951ср1Іаѕ -1м -1хм12 
-1/иѕг/іпсіоде/1ірхт12 


Это и есть те флаги, которые нужно задать при компиляции С$1. и 1ЪХМІ2. 
Флаг -1 показывает, что библиотека СМО Заепийс І1Ыгагу зависит от библиотеки 
Ваѕіс Ііпеаг А|веБга ЅиБргоргатѕ (ВІА), а та, в свою очередь, зависит от стан- 
дартной математической библиотеки. Вроде бы все библиотеки находятся в обыч- 
ных местах, потому что флагов -1 не наблюдается, однако флаг -1 определяет спе- 
циальное место для заголовочных файлов 1ЬЪХМІ2. 

Вернемся к командной строке; у оболочки есть интересная особенность: если 
заключить команду в обратные апострофы, то вместо команды будет подставлен 
ее результат. Иначе говоря, если ввести команду: 


9сс `ркд-сопіід --сЙад$ --116ѕ 951 11рхм1-2.0` -о зрес1Йс ѕресіѓіс.с 
то компилятор увидит: 


дсс -І/оѕг/іпс1оае/1ірхтм12 -1951 -1951сЬ1аѕ -1м -1хт12 -о зрес1Йс зрес1йс.с 


Таким образом, рко-сопіід многое делает за нас, но в стандарте она не описана, 
поэтому нельзя ожидать, что она имеется на любой машине или что любая биб- 
лиотека регистрируется в ее репозитории. Если у вас этой утилиты нет, то при- 
дется заняться самостоятельными исследованиями: почитать руководство по биб- 
лиотеке или поискать на диске, как было показано выше. 


А Часто существуют специальные переменные окружения для путей, например СРАТН или 

7. А? ВКАВУ РАТН или С _ТМСЬИОЕ РАТН. Их можно задать в своем файле .Баѕћс или в каком- 

І нибудь другом пользовательском перечне переменных окружения. Впрочем, они безна- 

дежно нестандартные - асс в Ипих и дсс в Мас используют разные переменные, а другой 

компилятор может понимать что-то совсем иное. Я считаю, что проще задавать эти пути 

для каждого проекта в отдельности в файле такейћіе или эквивалентном ему с помощью 

флагов -Г и -І. Если вы все же предпочитаете вышеупомянутые переменные путей, то хотя 

бы посмотрите в конце страницы руководства по своему компилятору список поддержи- 
ваемых переменных. 


Даже при наличии ркд-сопйд возникает острая необходимость в каком-нибудь 
инструменте, который автоматически соберет все необходимое воедино. Каждый 
отдельный элемент понять несложно, но долгая механическая работа утомляет. 
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Компоновка во время выполнения 


При компоновке со статическими библиотеками компилятор, по сути дела, копи- 
рует содержимое библиотеки в конечный исполняемый файл. Поэтому программа 
работает более-менее автономно. Разделяемые библиотеки прикомпоновываются 
к программе во время выполнения, то есть мы имеем ту же проблему поиска биб- 
лиотек, что и на этапе компиляции. Хуже того, теперь с этой проблемой могут 
столкнуться пользователи нашей программы. 

Если библиотека находится в одном из обычных мест, то жизнь прекрасна – во 
время выполнения система найдет библиотеку без труда. Если же ваша библио- 
тека находится в нестандартном месте, то нужен какой-то способ изменить путь 
поиска библиотек во время выполнения. Вот какие есть варианты. 

О Если пакет программы собирался с помощью Ащююо[5, то ІіЬќооЇ знает, ка- 

кие флаги добавить, и вам беспокоиться не о чем. 

О Наиболее вероятная причина, по которой необходимо изменить путь поис- 
ка, состоит в том, что вы храните библиотеки в своем домашнем каталоге, 
потому что не имеете прав суперпользователя (или не хотите ими пользо- 
ваться). Если все свои библиотеки вы устанавливаете в каталог /ірраѓћ, то 
нужно задать переменную окружения Ъ0_Р1ВКАВУ_РАТН. Обычно это делается 
в файле инициализации оболочки (.разНгс, .2зВгс или еще каком-то) с по- 
мощью команды: 


ехрогЕ 10 1ІВКАКҮ РАТН=1ірраєһћ: $10 1ІВКАКҮ РАТН 


Можно услышать предостережения против бездумного использования пе- 
ременной 10 1ІВКАКҮ РАТН (что, если кто-нибудь поместит в указанный в ней 
каталог вредоносную библиотеку с таким же именем, как у настоящей, а вы 
об этом не будете знать?), однако если все ваши библиотеки находятся в од- 
ном месте, то не так уж страшно добавить в путь один каталог, который вы 
будете тщательно контролировать. 

О Если программа компилируется с помощью рсс, СІапв или ісс, то в предпо- 
ложении, что библиотека находится в /ібраѓћ, добавьте строку 


ІрАрр=-11ірраєћ -М1, -К1ірраёћ 


в соответствующий такейе. Флаг -[ говорит компилятору, где искать биб- 
лиотеки для разрешения символов, флаг -И1 передает следующие далее фла- 
ги компоновщику через рсс/С]апё/1сс, а компоновщик вставляет каталог, 
указанный во флаге -В, в путь поиска библиотек, просматриваемый во время 
выполнения. К сожалению, ркд-сопйд обычно не знает о путях на этапе вы- 
полнения, поэтому эти флаги, возможно, придется добавлять вручную. 


Работа с файлами такеЯе 


Файл таке кладет конец всем этим бесконечным настройкам. По существу, это 
организованный набор переменных и однострочных скриптов оболочки. Описан- 
ная в стандарте РОЗ[Х программа таЁе читает команды и переменные из таке#е, 
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после чего конструирует за нас длинные командные строки. Прочитав этот раздел, 
вы уже вряд ли станете когда-нибудь вызывать компилятор напрямую. 

В разделе «МаКе@ве, или сценарий оболочки» ниже я еще вернусь к файлам 
такеНе, а пока приведу минимальный практически полезный таКећіе, который 
собирает простенькую программу, зависящую от одной библиотеки. Вот он цели- 
ком, всего шесть строчек: 

Р=ргодгат пате 
ОВЈЕСТЗ= 
СЕГАС5 = -9 -Йа11 -03 


ІрІВЅ= 
СС=с99 


$(Р): $ (ОВЈЕСТ5) 


Как им пользоваться? 

О Однократно: сохраните этот файл (под именем таќе/і1е) в том же каталоге, 
где находятся файлы с расширением .с. Если вы пользуетесь программой 
СМО Маке, то можете писать имя с большой буквы (Маѓејіе), чтобы вы- 
делить его среди прочих файлов. В первой строке укажите имя своей про- 
граммы (ргодпапе, а не ргодпате. с). 

О При каждой компиляции: наберите паке. 


Ваша очередь. Вот пример знаменитой программы Не!о.с [Кегпідћап 1978, стр. 6], со- 
стоящей всего из двух строк: 


#1пс1а4е <56аіо.һ> 
іп таіп() { ргіпёё ("Не110, мог1а.\п"); } 


Сохраните этот файл и показанный выше такейе в каком-нибудь каталоге и попробуйте 
выполнить описанные шаги для компиляции программы. Затем запустите ее. 


Задание переменных 


Скоро мы перейдем к вопросу о работе такеШе, а пока отметим, что пять из 
шести строк – это присваивания значений переменным (многие сейчас пусты). 
Это означает, что следует несколько подробнее побеседовать о переменных окру- 
жения. 


^ Исторически сложились два направления в разработке оболочек: первое основано пре- 

И 1; имущественно на оболочке Боурна, второе - на С-оболочке (С ѕће). В С-оболочке син- 

таксис задания переменных несколько отличается, например чтобы присвоить значение 

переменной СЕІАСб5, нужно написать ѕеї СЕЬАб5="-49 -На11 -03". Но в стандарте РОЅІХ опи- 

сан только синтаксис, основанный на оболочке Боурна, поэтому он и используется в этой 
книге. 


И в оболочке, и в программе паке значение переменной обозначается знаком 
$, но в оболочке пишут $уаг, а в паке имена переменных длиннее одного символа 
заключаются в скобки: $ (хаг). Поэтому при вычислении строки $ (Р) : $ (ОВУЕСТ$) 
в показанном выше таке е получится 


ргодгат папе: 
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Есть несколько способов уведомить паке о наличии переменной. 
О Установить переменную в оболочке перед вызовом таке и экспортировать 


ее. Это означает, что при запуске дочернего процесса оболочка поместит дан- 
ную переменную в список передаваемых ему переменных окружения. Что- 
бы установить переменную СЕЬАС$ в командной строке РОЗ[Х-совместимой 
оболочки, нужно написать: 


ехрогЕ СЕЬАС5='-4 -Ма11 -03' 


На своем домашнем компьютере я опускаю первую строку в файле таКе@е 
(Р=ргодгат папе) и вместо этого задаю переменную на все время сеанса 
командой ехрогі Р=ргодгат папе, что позволяет редактировать сам таке@е 
не так часто. 

Команду экспорта можно поместить в файл инициализации оболочки, на- 
пример .Баѕһгс или .25Вгс. Это означает, что при каждом входе в систему 
или при запуске новой оболочки эта переменная будет установлена и экс- 
портирована. Если вы точно знаете, что СЕІАСЗ всегда должна принимать 
одно и то же значение, можете установить ее в этом файле и забыть. 
Можно экспортировать переменную только для одной команды, поместив 
присваивание перед этой командой. Команда епу выводит список установ- 
ленных переменных окружения, поэтому, выполнив команду 


РАМТЅ=Ккакһі епу | дгер РАМТ 


вы увидите значение переменной РАМТ. Именно поэтому оболочка не по- 
зволяет ставить пробелы до и после знака равенства: пробел позволяет от- 
личить присваивание от команды. 

В этом случае переменная устанавливается и экспортируется только для 
команды в той же строке. Выполнив показанную выше команду, попробуй- 
те запустить епу | дер РАМТ$ и убедитесь, что переменная РАМТЅ больше не 
экспортируется. 

Никто не мешает задавать сразу несколько переменных: 


РАМТЅ5=Какһі РІАМТ5="Ёісиѕ {егп" епу | дгер 'Р.*МТ5' 
Этот прием, называемый в спецификации оболочки простой командой, 
подразумевает, что присваивание производится непосредственно перед 


записью самой команды. Это окажется существенно, когда мы перейдем 
к конструкциям оболочки, отличным от команд. Предложение 


УАК=уа1 1Ё [ -е ай1е ] ; Єһеп ./ргодгам иѕіпд УАК ; іі 


завершится с маловразумительной синтаксической ошибкой. Правильно 
писать так: 


1Е [ -е айіе ] ; ћеп УАВ=уа1 ./ргодгат иѕіпд МАЕ ; й 
Как в показанном выше такеШе, можно задать переменную в начале файла, 


в строках вида СЕГАб5=.... В такее разрешается оставлять пробелы до и 
после знака равенства. 
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О паке позволяет задавать переменные в командной строке независимо от обо- 
лочки. Таким образом, следующие две строки почти эквивалентны: 


паке СЕІАб5="-д -Иа11" Установить переменную в тайе/Ие. 
СЕЬАб$="-д -Иа11" таке Установить переменную окружения, видимую только таће и ее потомкам. 


Все эти способы, с точки зрения работы таКе е, эквивалентны, за исключени- 
ем одного нюанса: программы, вызываемые из паке, будут видеть новые перемен- 
ные окружения, но ничего не будут знать о переменных, установленных в самом 
таКейіе. 


Переменные окружения в С 


В программе на С переменную окружения можно получить с помощью функции деѓепу. 
Поскольку де{епу очень проста, ее можно использовать для проверки эффекта задания 
разных значений в командной строке. 

В примере 1.2 сообщение выводится на экран столько раз, сколько укажет пользова- 
тель. Текст сообщения задается в переменной окружения п54, а число повторений - 
в переменной герз. Обратите внимание, что в случае, когда деѓепу возвращает МО 
(обычно это означает, что переменная окружения не задана), мы по умолчанию берем 
значения 10 и «Не|о». 


Пример 1.2 * Переменные окружения позволяют быстро изменить параметры работы 
программы (деїепу.с) 


#1пс1и4е <56а116.һ>//дебепу, абоі 
#1пс1и4е <ѕбаіо.һ> //ргіпіёғ 


116 таіп() { 
сһаг *герѕќехі = дебепу ("герѕ"); 
іп герѕ = герѕіехі ? абоі (герѕёехі) : 10; 


сһаг *тѕд = дебепу ("тѕд"); 


1Ё (1т59) тѕ9 = "Не11о."; 

Ғог (іп 1=0; 1< герѕ; 1++) 
ргіпеЁ ("%5\п", 59); 

} 


Как и раньше, мы можем экспортировать переменные, так чтобы они действовали только 
в данной строке; это еще больше упрощает процесс передачи переменной программе. 


герѕ=10 тѕд="На" . /дебепу 
п$9="На" . /десепу 
герѕ=20 тѕд=" " ./дебепу 


Выглядит это странновато, ведь естественно ожидать, что параметры программы ука- 
зываются после имени, но бог с ней, со странностью, зато внутри самой программы 
нам почти ничего не пришлось делать, так что мы получили именованные параметры 
чуть ли не задаром. 

Набравшись побольше опыта, вы сможете изучить описанную в РОЅІХ функцию дегоре 
или предлагаемую СМУ функцию агдр рагѕе, которые позволяют обрабатывать входные 
параметры обычным способом. = 


В паке есть также несколько встроенных переменных. Ниже перечислены те из 
них (все описаны в РОЅІХ), которые встретятся в рассматриваемых далее правилах. 
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Полное имя целевого файла. Под целевым понимается файл, который предсто- 
ит создать, например о-файл, получающийся в результате компиляции с-файла, 
или программа, являющаяся результатом компоновки о-файлов. 


$* 
Имя целевого файла без суффикса. Так, если целевой файл называется ртор.о, то 
$* содержит ртор, а $*.с принимает значение ртов.с. 


$< 

Имя файла, в ходе обработки которого создается текущий целевой файл. Соз- 
дание файла ртор.о, вероятно, обусловлено тем, что недавно изменился файл 
ртғор.с, поэтому $‹ будет равно ртог.с. 


Правила 


Теперь перенесем внимание на процедуры, выполняемые при обработке файла 
такеЁе, а затем обсудим, как на этот процесс влияют переменные. 
Помимо задания переменных, в таке е имеются такие части: 


цель: зависимости 
скрипт 


Если инициируется создание некоторой цели путем исполнения команды паке 
{агдек, то система проверяет зависимости. Если целью является файл, если эта 
цель зависит только от файлов и при этом цель новее (то есть изменена позже) 
своих зависимостей, то файл актуален, и ничего делать не нужно. В противном 
случае обработка цели откладывается, выполняются или генерируются ее зависи- 
мости, быть может, с помощью другой цели, а когда обработка всех зависимостей 
завершится, выполняются команды создания исходной цели. 

Например, прежде чем стать книгой, этот текст был серией статей в бло- 
ге (һр:/ /тойеііпруіћааќа.оге). У каждой статьи было две версии – НТМІ и 
РПЕ - сгенерированные с помощью системы ГаТеХ. Опуская многочисленные 
детали (в частности, различные флаги Іаѓех2ћіл1), приведу упрощенный таКейе, 
предназначенный для выполнения этой процедуры. 

М Если вы копируете эти фрагментарные кусочки с экрана или с бумаги в файл такеїііе, 


имейте в виду, что красная строка формируется с помощью знака табуляции, а не пробе- 
лов. Так решил РОЅІХ. 


а11: һт1 ос рор1іѕһћ 


ос: 
РЧЙакех $(Е).кех 


ћеті: 
1афех -іпёегасбіоп раёсһтоде $ (#) 
Іабех2һет1 $ (#) . ех 


рор1ізѕћ: 
ѕср $(#).раё $ (В1одѕегуег) 


Глава 1 Настраиваем среду для компиляции % 41 


Значение переменной Ё я задавал из командной строки, например ехрогї Е=р- 
паке. При запуске паке без параметров проверяется первая по порядку цель, а11. 
Иными словами, просто паке эквивалентно паке гі Сагдее. Цель а1] зависит от 
целей рт], ос и руЪ1 151, они и проверяются именно в таком порядке. Если я еще 
не готов отправить свое творение в мир, то могу набрать команду паке Вт] ос, 
которая выполнит лишь указанные шаги. 

В простом показанном выше таке е есть только одна группа цель/зависи- 
мость/скрипт. Например: 


Р=аотаёћ 
ОВЈЕСТЅ=аааіёіоп.о ѕирёгасќіоп.о 


$(Р): $ (ОВЈЕСТ5) 


Это похоже на последовательность зависимостей и скриптов в такейе для 
публикации статьи в блоге, только скрипты неявные. В данном случае Р=йопаёћ — 
подлежащая компиляции программа, она зависит от объектных файлов 204ійоп.о 
и ѕиђігасйоп.о. Поскольку аййіѓіоп.о не встречается в виде цели, паке применя- 
ет неявное правило: компилировать с-файл в о-файл. То же самое делается для 
ѕиБтасіоп.о и аотаѓћ.о (потому что СМО паке неявно предполагает, что в представ- 
ленной ситуации допаёћ зависит от Фотаѓћ.о). После построения всех объектных 
файлов выясняется, что скрипт для построения цели $ (Р) не указан, поэтому СМО 
паке подставляет свой скрипт по умолчанию, который компонует из о-файлов ис- 
полняемую программу. 

У совместимой с РОЅІХ программы паке имеется специальный рецепт для ком- 
пиляции объектного о-файла из исходного с-файла: 


$ (СС) $ (СЕТАС5) $ (10ЕҒІАС5) -о $@ $*.с 


Здесь переменная $ (СС) представляет компилятор С; в стандарте РОЅІХ опре- 
делено, что по умолчанию СС=с99, но в современных версиях СМИ паке считается, 
что СС=сс, а сс обычно является ссылкой на дсс. В минимальном файле такКейе 
в начале этого раздела переменной $ (СС) явно присвоено значение с99, перемен- 
ной $ (СЕІАСЅ) – набор флагов, а переменная $ (І0Е1А68) вообще не задана, поэтому 
вместо нее подставляется пустая строка. Таким образом, если паке определит, что 
нужно построить файл уоцг_ргодгам.о, то при таком таке @е будет выполнена сле- 
дующая команда: 


с99 -9 -Ма11 -03 -о уоиг ргодгат.о уоиг ргодгат.с 

Если С№О паке решит, что требуется построить исполняемую программу из 
объектных файлов, то она воспользуется следующим встроенным рецептом: 
$ (СС) $(ЪОЕЬАб$) Пг5Ё.о ѕесопа.о $ (.011В5) 

Напомним, что порядок файлов важен для компоновщика, поэтому нам нужны 


две относящиеся к нему переменные, одной не обойтись. В нашем примере для 
компоновки нужно было бы выполнить команду 


сс зрес1Йс.о -1Бгоаа -1депега1 
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Сравнив ее с рецептом, мы видим, что нужно следующим образом задать пе- 
ременную 1011В8$=-1ргоаа -1депега1. Если бы мы задали 10ЕАб$=-1ргоай -1депега1, 
то после подстановки переменной в рецепт получилась бы команда сс -1ргоай 
-1депега] ѕресійс.о, которая, скорее всего, не приведет к желаемому результату. От- 
метим, что ІрЕ1АСЅ входит также в рецепт компиляции с-файлов в о-файлы. 

3 Чтобы получить полный перечень встроенных в вашу версию паке правил и переменных, 
У выполните команду 


паке -р > аеЁаи1Е_ги]е$ 


Итак, игра состоит в том, чтобы определить, какие переменные нужны, и задать 
их в таке е. Вам все же придется провести кое-какие изыскания, чтобы узнать 
правильные значения флагов, но, по крайней мере, их можно будет один раз запи- 
сать в таКе е и больше об этом не думать. 


Ё Ваша очередь. Модифицируйте такейе для компиляции егѓї.с. 


При работе с ШЕ, СМАКЕ или иными альтернативами совместимой с РОЗ Х 
программе паке в игру «найди переменные» играть все равно придется. Я продол- 
жу обсуждение минимального таке е, и у вас не должно возникнуть сложностей 
с определением соответствующих переменных в своей ШЕ. 

О Переменная СЕІАб5 давно и прочно укоренилась в практике, но переменная, 
определяющая флаги компоновщика, меняется от системы к системе. Даже 
переменная 1011В$ не определена в РОЗХ, но именно она используется 
в СМИ паке. 

О В переменных СЕТАСЅ и ГОМВ$ мы будем задавать все флаги компилятора и 
компонуемые библиотеки. Если в вашей системе есть программа ркр-сопће, 
воспользуйтесь обратными апострофами. Например, в своей системе я поч- 
ти все программы компоную с библиотеками Арорћепіа и СІ1Ь, поэтому 
такейе у меня выглядит так: 


СЕЬАС$=`рКа-сопйа --сЙадз арорһепіа 911Ъ-2.0` -9 -Ма11 -ѕ@а=9пи11 -03 
І0р11Вѕ$= `ркд-сопёід --11Ь$ арорћһепіа 91ір-2.0` 


Или можно задать флаги -І, -І и -1 вручную: 


СЕТАС5=-1/һоте/Ь/гоо/іпс1џае -9 -Иа11 -03 
рІ1В5$=-1/ћоте/6/гооб/1ір -1меіга1ір 


О Если вы добавили местоположение библиотеки и соответствующих ей за- 
головков в строки БОБВ$ и СЕ1Аб5 и знаете, что в вашей системе это работа- 
ет, то не имеет смысла впоследствии удалять эту информацию. Так ли уж 
важно, что конечный исполняемый файл будет на 10 килобайт длиннее, чем 
мог бы получиться при создании специального таке е для каждой новой 
программы? Это означает, что можно написать один таке е, содержащий 
сведения обо всех библиотеках в системе, и копировать его из проекта в про- 
ект без изменений. 
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О Если имеется два (или более) С-файла, добавьте ѕесопа.о {114.0 и т. д. 
в строку 0ВЈЕСТЅ (запятые не нужны, имена разделяются только пробела- 
ми) в начале показанного выше файла такеЁе. Программа паке использует 
эту информацию, чтобы понять, какие файлы строить и с помощью каких 
рецептов. 

О Если программа состоит всего из одного с-файла, то таке е вообще необя- 
зателен. Находясь в каталоге, где есть только файл ег/.с, но нет таке Ше, вы- 
полните следующие команды в оболочке: 
ехрог СЕГАС5='-4 -Ма11 -03 -$&4=9пи11' 


ехрогЕ 1011В5='-1т' 
паке егЁ 


и полюбуйтесь, как паке пользуется своими знаниями о компиляции С, что- 
бы сделать все остальное. 


Какие флаги компоновщика задавать при построении разделяемой 
библиотеки? 


Честно говоря, не знаю. В разных операционных системах (отличающихся как по типу, 
так и по году выпуска) и даже в одной системе правила зачастую различаются, и разо- 
браться в них нелегко. 

Лучше пользуйтесь инструментом [/Ью09/, описанным наряду с прочими в главе 3, уж 
он-то знает все о генерации разделяемых библиотек в любой операционной систе- 
ме. Я рекомендую потратить время на изучение Ащоюо!$ и тем решить проблему ком- 
пиляции разделяемых библиотек раз и навсегда. Это полезнее, чем тратить время на 
знакомство с флагами компилятора и процедурой компоновки для каждой целевой 
системы. 


Сборка библиотек из исхолного кола 


До сих пор мы говорили о компиляции своей программы с помощью паке. Компи- 
ляция же чужого кода — совершенно другая история. 

Попробуем на примере какого-нибудь пакета. Библиотека СМУ Заепийс 
ГаБгагу (СГ) включает великое множество функций для численных расчетов. 

Пакет СІ. сформирован с помощью Аиюоюо06, комплекта инструментов для 
подготовки библиотеки к использованию на любой машине. Своей цели этот ком- 
плект достигает путем проверки всех известных платформенных причуд и выбора 
подходящего обходного решения. В наши дни подавляющее большинство про- 
грамм распространяется с помощью АиќоѓооЇѕ; подробно о том, как подготовить 
пакет для своей программы вместе с библиотеками, будет рассказано ниже в раз- 
деле «Подготовка пакета с помощью Ащюотюо[». А пока будем выступать в роли 
пользователей и порадуемся тому, как легко и быстро можно установить полезные 
библиотеки. 

СГ. часто можно получить в готовом виде с помощью менеджера пакетов, но 
в педагогических целях покажем, как скачать исходный код СЇ. и откомпилиро- 
вать его в предположении, что у вас есть привилегии суперпользователя гооё на 
своем компьютере. 
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маде Екр://Еер.9пи.ог9/9пи/9$1/931-1.15.5аг.92 ® 


баг ху2ЕЁ 951-*92 9 
ей. 951-1.15 

./сопнаиге © 
маке 

зи4о маке іпѕёа11 ө 


© Скачать сжатый архив. С помощью менеджера пакетов установить программу 
дет, если ее нет в системе, или перейти по указанному ОКІ -адресу в браузере. 

Ө Распаковать архив: х=извлечь, у=подробная информация, 2=распаковывать 
с помощью 0921р, #=имя файла. 

Ө Определить причуды машины. Если сопйдиге выводит сообщение об ошибке, 
вызванной отсутствием какого-то элемента, установить его с помощью менед- 
жера пакетов и запустить сопйдиге снова. 

Ө Установить в нужное место – при наличии прав. 


Если вы делаете все это дома, то, наверное, привилегии гоо у вас есть, и все 
отработает на ура. Если же вы упражняетесь на работе, используя разделяемый 
сервер, то маловероятно, что вам дали права суперпользователя, поэтому вы не 
сможете ввести пароль, который запрашивается на последнем шаге. В таком слу- 
чае потерпите до следующего раздела. 

Установили? В примере 1.3 приведена короткая программа, которая пытается 
найти 95-процентный доверительный интервал с помощью функции из библиоте- 
ки С5Г; попробуйте собрать ее и запустить. 


Пример 1.3 + Переработка примера 1.1 с применением ОЕ (95І_егё.с) 


#іпс1џае <951/951 саё.һ> 
#іпс1џае <56аіо.һ> 


іп таіп () { 
аоџр1е роёёот бёаії = 951 сї даџѕѕіап Р(-1.96, 1); 
ргіпе# ("Агеа реснееп [-1.96, 1.96] : %\п", 1-2*росёот баі); 


Чтобы воспользоваться только что установленной библиотекой, необходимо 
изменить таке е для сборки программы, в которой эта библиотека используется, 
указав пути к файлам. 

В зависимости от того, есть в системе ркд-сопйд или нет, нужно сделать одно из 
двух: 

Ір1В$= `ркд-сопіід --115$ 951` 


# или 
Ір1Вѕ$=-1951 -19$1сЬ1а$ -1т 


Если библиотека установилась не в стандартное место и рко-соліід отсутствует, 
то нужно будет добавить пути в переменные, задаваемые в начале файла, напри- 
мер: СЕЬАС$=-Т/изг/1оса1/1пс1иде и 1011В5=-1/иѕг/1оса1/11р -Ж1, -К/иѕг/1оса1/11р. 
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Сборка библиотек из исходного кода 
(даже если системный администратор против) 


Вы, конечно, обратили внимание на сделанную выше оговорку о необходимости 
иметь привилегии гоо для установки в обычные места, определенные в стандарте 
РОЗХ. Но при работе с разделяемым компьютером в офисе или по какой-то иной 
причине таких привилегий у вас может и не быть. 

Тогда придется уходить в подполье и создавать свой личный корневой каталог. 
Первым делом нужно просто создать этот каталог: 


ткаіг -/гоое 


У меня уже есть каталог -/йесй, в котором я храню разного рода технические 
средства, руководства и фрагменты кода, поэтому я создал в нем подкаталог 
~ Лесй/тооё. Имя не имеет значения, мне просто понравилось имя -/7ооё. 

г ^^ Оболочка подставляет вместо тильды полный путь к домашнему каталогу, избавляя от не- 
\./ обходимости набирать лишнее. Стандарт РОЅІХ требует лишь, чтобы подстановка произ- 
водилась только в начале слова или после двоеточия (последнее необходимо для пере- 
числения путей в переменной РАТН), но многие оболочки делают это и тогда, когда тильда 


находится в середине слова. Другие программы, в частности паке, могут как распозна- 
вать, так и не распознавать тильду. 


Следующий шаг – добавить всюду, куда нужно, путь к каталогу в нашей но- 
вой «корневой файловой системе». Что касается программ, то это переменная РАТН 
в файле „Базйгс (или эквивалентном ему): 


РАТН=-/гоо*/Ъ1п:$РАТН 


Поместив путь к подкаталогу Біл в новом корневом каталоге в начало исходной 
РАТН, мы гарантируем, что при поиске программ сначала будет просматриваться 
именно он. Поэтому вы можете заместить любую программу, которая уже находит- 
ся в стандартном системном каталоге, другой, предпочтительной для вас, версией. 

Чтобы ваши С-программы компоновались с нужными вам библиотеками, по- 
полните пути поиска в рассмотренном выше таке#е: 


101ІВЅ$=-1/һоте/уоцг һоте/гооё/1ір (затем прочие флаги: -1851 Іт ...) 
СҒІАбЅ=-І/һоте/уоџг һҺоте/гооб/іпсіџае (плюс -в - №1! -03...) 


Сформировав свой локальный корень, вы можете использовать его и в других 
системах, например в переменной СТАЗЗРАТН, применяемой в Јаха. 

Последний шаг – установка программ в новый корень. Если у вас имеется ис- 
ходный код, подготовленный с помощью Ащююо[5, то нужно лишь добавить флаг 
--ргейх=$НОМЕ/ гоо: 


./сопйаиге --ргейх=5НОМЕ/гооЕ; таке; таке іпзёа11 


На шаге установки ѕийо не потребуется, потому что вы находитесь на собствен- 
пой территории. 

Поскольку программы и библиотеки «живут» в вашем домашнем каталоге и 
имеют не больше прав, чем вы сами, системный администратор не вправе ругаться, 
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что они могут кому-то навредить. Если сисадмин все-таки недоволен, то, как это 
ни грустно, придется с ним поссориться. 


Руководство 


Допускаю, что были времена, когда руководство представляло собой бумажный доку- 
мент, но в наши дни оно существует в виде команды пап. Например, чтобы прочитать 
о функции э(г{ок, нужно набрать тап ѕїігіок, и вы узнаете, какой заголовок включать 
в программу, какие аргументы функция принимает и как она должна использоваться. 
Страницы руководства написаны конспективно, иногда в них нет примеров и вообще 
предполагается, что читатель уже имеет общее представление о том, что делает функ- 
ция. Если нужно более подробное пособие, то поисковик, скорее всего, предложит 
несколько ресурсов в Интернете (а в случае конкретно ѕігіок смотрите раздел «Песнь 

о ѕігіок» ниже. Руководство по библиотеке СМЦ С, которое также легко найти в Сети, 

написано очень понятно и рассчитано на начинающих. 

• Если не можете вспомнить, как называется то, что вы ищете, то можно воспользо- 
ваться однострочным рефератом, присутствующим в каждой странице руководства. 
Команда пап -К ѕеагсһёегп производит поиск по этим рефератам. Во многих системах 
есть также команда аргоро$, аналогичная пап -К, но с некоторыми дополнительными 
возможностями. Для выделения того, что меня интересует, я обычно подаю выход 
аргороз на вход дгер. 

® Руководство разбито на разделы. В разделе 1 собраны программы, запускаемые из 
командной строки, а в разделе З – библиотечные функции. Если в системе имеется 
программа рг1пЕЁ, то команда пап рг1п(Ё покажет документацию по ней, а команда пап 
Зрг1пЕЕ - документацию по функции рг1п(Ё из стандартной библиотеки С. 

® Для получения дополнительных сведений о команде пап (в том числе полного списка 
разделов) наберите пап пап. 

• В ваш текстовый редактор или ІрЕ могут быть встроены средства быстрого поиска 
страниц руководства. Например, при работе с редактором хі можно подвести курсор 
к слову и нажать К – откроется страница руководства по этому слову. 


Компиляция С-программы с помошью 
встроенного локумента 


Мы уже несколько раз видели общую последовательность компиляции. 

1. Задать переменную, содержащую флаги компилятора. 

2. Задать переменную, содержащую флаги компоновщика, в том числе по од- 

ному флагу -1 для каждой используемой библиотеки. 

3. С помощью рецептов, встроенных в паке или ШЕ, преобразовать перемен- 

ные в полные команды компиляции и компоновки. 

В оставшейся части главы мы проделаем все это еще один, последний раз, све- 
дя конфигурацию к абсолютному минимуму: с помощью одной лишь оболочки. 
Если вы из тех людей, что учат скриптовые языки путем копирования фрагментов 
кода в интерпретатор, то сможете точно так же скопировать написанный на С код 
в командную строку. 


Включение файлов-заголовков из командной строки 
В сс и в С апр есть удобный флаг для включения заголовков. Например, 


9сс -1пс1а4е $41о.В 
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эквивалентно строке 
#1пс1и4е <5%а1о.в> 


в начале С-файла; аналогично с1апд -1пс14е $1 910.1. 

Добавив сюда вызов компилятора, мы наконец сможем записать программу 
ћеПо.с в виде одной строки, каковой она и должна быть: 
116 ма1п(){ рг1пЕЕ("Не11о, мог1а.\п"); } 


а откомпилировать так: 
9сс -1пс1а4е ѕаіо.һ Һе11о.с -о В1 --50а=9пи99 -Иа11 -9 -03 


или воспользовавшись командами оболочки: 


ехрогї СЕЬАС5='-д -Ма11 -1пс1а4е $Е41о.1' 
ехрогі СС=с99 
маке Ве11о 


Такое использование флага -1пс104е зависит от компилятора и подразумевает 
перенос части информации из кода в инструкции компиляции. Если вы считаете 
подобную практику порочной, забудьте про этот совет. 


Универсальный заголовок 


Я хотел бы отвлечься от основной темы и посвятить несколько абзацев файлам- 
заголовкам. Полезный заголовок должен включать псевдонимы типов, опреде- 
ления макросов и объявления функций, которые необходимы коду, пользующему- 
ся этим заголовком. С другой стороны, он не должен включать псевдонимов типов, 
определений макросов и объявлений функций, которых код использовать не будет. 

Чтобы в точности удовлетворить оба этих условия, придется писать отдель- 
ный заголовок для каждого файла с кодом, включая те и только те части, которые 
в этом коде используются. Но так никто не делает. В каких-то случаях заголовок — 
это набор частей, которые, по мнению автора, связаны между собой. А иногда за- 
головок содержит весь открытый интерфейс некоторой библиотеки. Возможно, 
в вашем проекте есть какие-то части, востребованные в разных местах, тогда вы 
заводите для них внутренний заголовок. 

Было время, когда компилятору требовалось несколько секунд или минут, 
чтобы откомпилировать даже сравнительно простую программу, поэтому любая 
попытка сократить объем выполняемой компилятором работы имела заметный 
человеку эффект. Но теперь файлы 50.1 и $&41.Й на моей машине содержат при- 
мерно 1000 строк каждый (наберите нс -1 /иѕг/ілсІџйе/ѕ5411Ы.ћ), а файл йтел — 
еще 400 строк, то есть такая вот программа из семи строчек: 

#1пс1ае <ёіте.һ> 


#1пс1и4е <3Е41о.в> 
#1пс1и4е <56а11р.һ> 


116 ма1лп() { 
ѕгапа (Е 1те (МО) ); // Инициализировать генератор случайных чисел. 
ре1пЕЁ ("%і\п", гапа()); // Напечать число. 


} 


на самом деле занимает -2400 строк. 
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Но компилятор уже не считает, что 2400 строк – большая проблема, на ком- 
пиляцию этой программы уходит меньше секунды. Так зачем тратить время на 
скрупулезный отбор строго необходимых программе заголовков? 

Ниже будут приведены примеры, в которых используется библиотека СП, в них 
в начале стоит директива #іпсІоае <911Ь.1>. Этот заголовок включает 74 подзаголов- 
ка, охватывающих все разделы СП. И это правильный подход, потому что те из нас, 
кто не хочет терять времени на выбор только нужных разделов библиотеки, могут 
ограничиться одной строкой, включающей все, а те, кому необходим детальный кон- 
троль, могут включить именно те заголовки, которые реально необходимы. Хорошо 
было бы иметь такой универсальный заголовок и для стандартной библиотеки С; 
в начале 1980-х годов это было не принято, но легко изготовить его самостоятельно. 
Ваша очередь. Напишите единственный заголовок, назвав его, скажем, а//ћеаа5.ћ, в ко- 

торый включите все заголовки, которые используете. Например: 


#1пс1и4е <таёћ.һ> 
#іпс1џае <ііте.һ> 
#іпс1џае <5ѕЁаіо.һ> 
#іпс1џае <ипіѕіа.һ> 
#іпс10џаӢе <5а1ір.һ> 
#1пс1и4е <951/951 гпд.һ> 


Не могу точно сказать, как он должен выглядеть, потому что не знаю, какими заголовками 
вы пользуетесь в своей работе. 

Создав агрегированный заголовок, вы можете помещать такую строку 

#1іпс1џае <а11һеааѕ.һ> 

в начало любого программного файла и больше вообще не думать о заголовках. Конечно, 
приего раскрытии получится, быть может, 10 000 строк лишнего кода, не имеющего ника- 


кого отношения к вашей программе. Но вы этого не заметите, потомучто неиспользуемые 
объявления не отражаются на конечном исполняемом файле. 


Если вы пишете заголовок, предназначенный для других людей, то в соответ- 
ствии с правилом отсутствия ненужных элементов он не должен содержать ди- 
рективы #1пс104е "а11һеайѕ.һ", подгружающей все определения и объявления из 
стандартной библиотеки. Более того, ваш открытый заголовок может вообще нс 
содержать ни одного элемента из стандартной библиотеки. Это общее правило: 
в вашей библиотеке может быть код, в котором используются связанные списки 
из СПЬ, но тогда директива #1пс1и4е <9115.1> должна находиться в файле кода, апе 
в открытом заголовке библиотеки. 

Возвращаясь кидеебыстрой компиляции из командной строки, отмечу, что уни- 
версальный заголовок ускоряет написание простеньких программ. При наличии 
такого заголовка в среде 5сс или С!апё становится лишней даже строка #1пс1иде 
<а!1еа9з .1>, потому что можно вместо нее добавить флаг -1пс1 иде а! 1ћеайѕ.ћ в пе- 
ременную СЕТАб5 и не думать о том, какие не относящиеся к самому проекту за- 
головки включать. 


Встроенные документы 


Встроенные документы поддерживаются во всех РОЗ[Х-совместимых оболочках, 
их можно использовать при программировании на С, Ру{оп, Рег| и любом другом 
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языке. В этой книге они встречаются часто, внося в текст некоторое оживление. 
Кроме того, встроенные документы облегчают создание многоязыковых скриптов. 
Никто не мешает произвести синтаксический разбор на Регі, выполнить матема- 
тические вычисления на С, а затем использовать Спир|оё для создания красивых 
картинок - и все это в одном текстовом файле. 

Вот пример на Руёћоп. Обычно написанный на этом языке скрипт запускается 
следующим образом: 


руєћоп уоиг ѕсгірё.ру 


Русћор позволяет задать специальное имя файла -, обозначающее стандартный 
ВВОД: і 


есһо "ргіпё 'һћі.'" | рубһоп - 


Теоретически можно было бы с помощью команды есћо разместить в командной 
строке весьма длинные скрипты, но вы быстро устанете от мелких, но нежелатель- 
ных отвлечений; например, нужно писать \"ћі\" вместо "ћі". 

На выручку приходит встроенный документ, в котором ничего экранировать не 
нужно. Вот пример: 
русћоп - <<"ХХХХ" 
1іпеѕ=2 


ргіпе "\пТһіѕ зсг1рё 1$%1 11пез 1опд.\п"% (1іпеѕ,) 
ХХХХ 


О Встроенные документы — стандартная возможность оболочки, поэтому 
должны работать в любой РОЅІХ-совместимой системе. 

О Вместо "ХХХХ" можно подставить любую другую комбинацию символов, на- 
пример очень популярна "ЕОЕ", а "----- " отлично смотрится при условии, 
что количество дефисов в начале и в конце совпадает. Когда оболочка видит 
строку, состоящую только из выбранной комбинации символов, она прекра- 
щает подавать скрипт на стандартный ввод программы. И никакого другого 
анализа не производит. 

О Существует также вариант, начинающийся с <<-. В этом случае удаляются 
все знаки табуляции в начале каждой строки, поэтому встроенный доку- 
мент можно поместить в секцию скрипта оболочки, имеющую отступ, не 
нарушая структуры отступов. Разумеется, для встроенного документа, со- 
держащего код на Ру(ћоп, это было бы катастрофой. 

О Отметим также различие между <<"ХХХХ" и <<ХХХХ. Во втором случае обо- 
лочка разбирает некоторые элементы, то есть может подставить значения 
переменных вида $51е1] үагіар]е. В оболочке символ $ активно использу- 
ется для обозначения переменных и других конструкций, но в языке С этот 
символ не имеет специального значения. Похоже, люди, которые писали 
их, спроектировали ее сразу от начала до конца, чтобы легко было писать 
скрипты оболочки, порождающие код на С... 
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Компиляция из ${т 


Но вернемся к С: мы можем использовать встроенные документы для компиля- 
ЦИИ с ПОМОЩЬЮ 5СС ИЛИ С ап С-кода, вставленного в командную строку. А можем 
включить несколько строк на С в многоязычный скрипт. 

Мы не собираемся использовать таке е, поэтому понадобится однострочная 
команда компиляции. Чтобы упростить себе жизнь, заведем для нее псевдоним. 
Выполните следующие команды вручную или поместите их в свой файл „фазйгс, 
.25йгс или подходящий эквивалент: 
до_115з="- Іт" 


90_Надз="-д -Ма11 -1пс1и4е а11һеааѕ.һ -03" 
а11аз до с="с99 -хс - $90_116$ $90 Падѕ" 


Здесь 2/леааѕ.ћ — созданный ранее агрегированный заголовок. Флаг -1пс1иде 
позволяет не думать о заголовках при написании кода на С, и, как я обнаружил, 
история БазВ сбоит, если в С-коде встречается символ #. 

В строке компиляции вы видите уже знакомый дефис -, означающий, что текст 
читается не из файла, а из $ т. Флаг -хс говорит, что этот текст следует интерпре- 
тировать как код на С. Поскольку рсс означает «СМО Сотрііег Соесііоп» (набор 
компиляторов СМИ), а не «СМО С Сотрііег» (компилятор СМИ С), то без этого 
флага невозможно понять, что речь идет о коде на С, так как нет имени файла, 
оканчивающегося на .с. Следовательно, мы должны явно сообщить, что это код 
не на ]ауа, Еоггап, ОБесйуе С, Ада или С++ (то же справедливо и в отношении 
С/ап8, пусть даже это название вызывает ассоциации с С {априаре). 

Все, что вы делали при настройке переменных 101185 и СЕІАСЅ в таке е, повто- 
рите здесь. 

Теперь все готово и можно откомпилировать С-код прямо в командной строке: 


до с << '---' 
116 таіп () {(ргіпеё ("Не110о Ёгом ће соттапа 11пе.\п"); } 


.Га.ооЕ 


Мы можем воспользоваться встроенным документом для вставки коротких 
С-программ в командную строку, что позволяет без лишних хлопот писать неболь- 
шие тестовые программы. Не нужен не только таке@Ше, но даже и входной файл'. 

Не думайте, что все вышеописанное должно стать основным способом работы. 
Но вставлять фрагменты кода в командную строку забавно, а возможность встав- 
лять коротенький код на С в длинный скрипт оболочки – это вообще чудо. 


' ВРОЅІХ определено соглашение о том, что если первая строка файла имеет вид 
#'апіпёегргебег 


то при запуске такого файла из оболочки исполняется программа апіпќегргеќег. Это очень 
удобно для интерпретируемых языков типа Рег| или Ру(ћоп (особенно если учесть, что знак 
# означает в них начало комментария, так что первая строка игнорируется). Пользуясь со- 
ветами из этого раздела, вы могли бы написать скрипт, скажем с995ћ, который делал бы то, 
что требуется, для С-файла, начинающегося строкой #!с995ћ: отрезал бы первую строку, все 
остальное передавал бы по конвейеру компилятору, а в конце запускал бы сгенерированную 
программу. Впрочем, Рис Улерих уже написал такой скрипт и опубликовал его в Сієћир. 


Глава 


о В Я] 


Отлалка, тестирование, 
документирование 


Ползу 

По твоему окну 

Ты мнишь, что мне неловко, 

А я вот жду... 

Чтоб завершить свою уловку. 
— Уге «І Ат (ће ЕІу» 


В этой главе мы рассмотрим средства отладки, тестирования и документирования 
вашего творения - то, что необходимо для доведения потенциально полезного со- 
брания скриптов до чего-то, на что вы сами и другие люди смогут положиться. 

Поскольку С оставляет программисту свободу творить в памяти совершенно 
немыслимые вещи, отладка является одновременно банальной проверкой логики 
(с помощью ББ) и технически более сложной задачей вылавливания неправиль- 
ного выделения и утечек памяти (с помощью Уаіегіпд). В плане документирования 
мы рассмотрим один инструмент на уровне интерфейса (Оохудеп) и другой, кото- 
рой помогает документировать и разрабатывать каждый шаг программы (СҰЕВ). 

В этой главе мы также вкратце коснемся тестовой оснастки – комплекта 
средств, позволяющего быстро писать многочисленные тесты программы. И за- 
вершим главу рассмотрением стратегии уведомления об ошибках и принципов 
обработки данных, вводимых пользователем, и ошибок в них. 


Работа с отладчиком 


Первый совет касательно отладчика будет прост и краток: 
Пользуйтесь отладчиком, обязательно. 


Кто-то скажет, что это и не совет вовсе, потому что кто же не пользуется от- 
ладчиком? Но поскольку это второе издание книги, могу сообщить, что одной из 
самых часто повторяющихся просьб было включить более подробное введение 
в работу с отладчиком - для многих читателей это было откровением. 

Некоторые считают, что обычно ошибки - результат неправильного понимания 
в широком смысле, тогда как отладчик дает только низкоуровневую информацию 
о состоянии переменных и стека вызовов. Действительно, отыскав место ошиб- 
ки в огладчике, необходимо остановиться и подумать о том, что привело к этой 
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ошибке и не проявится ли та же проблема в каком-нибудь другом месте. Иногда 
в свидетельство о смерти включают глубокий анализ причины: смерть произошла 
в результате ‚ что явилось результатом ‚ что явилось резуль- 
татом ‚ что явилось результатом . После того как с помощью 
отладчика вы провели такой анализ и стали лучше понимать свою программу, об- 
ретенное знание следует инкапсулировать в дополнительных автономных тестах. 

Теперь что касается слова «обязательно». Прогон программы под отладчиком 
обходится практически бесплатно. И не стоит извлекать отладчик на свет божий, 
только когда что-то ломается. Линус Торвальдс говорит: «Я пользуюсь отлад- 
чиком постоянно... вроде как накачанным дизассемблером, который еще и про- 
граммировать можно»'. Ну неужели вас не прельщает возможность остановиться 
в любом месте, повысить уровень детализации вывода простой командой рг1пё 
уегроѕе++, досрочно выйти из цикла Рог (іпі 1=0; 1<10; 1++), введя команды ргіпї 
1=100 и сопёіпџе, или протестировать функцию, подав ей на вход различные значе- 
ния? Любители интерактивных языков правы в том, что взаимодействие с кодом 
улучшает процесс разработки во всех отношениях; но они так и не удосужились 
дочитать учебник С до главы об отладке и не знают, что все эти интерактивные 
штучки применимы ик С. 

Для чего бы вы ни использовали отладчик, он должен уметь представлять хра- 
нящуюся в программе отладочную информацию (например, имена переменных и 
функций) в понятном человеку виде. Чтобы включить в исполняемый файл отла- 
дочные символы, при компиляции следует указать флаг -9 (например, в перемен- 
ной СРІАСЅ). Причин не использовать флаг -9 очень мало – он не замедляет работу 
программы, а увеличение размера файла на килобайт-другой в большинстве слу- 
чаев несущественно. Отладка также упрощается при отключении оптимизации 
с помощью флага -00 (О нуль), потому что иногда оптимизатор устраняет пере- 
менные, которые могли бы оказаться полезны при отладке, да и вообще видоизме- 
няет код всякими неожиданными способами. 

Я в основном рассматриваю СОВ, потому что в большинстве РОЅІХ-совмес- 
тимых систем ничего другого просто нет?. Отладчик ГТ.ОВ (поставляемый вмес- 
тес ЦУМ/С!апв) постепенно набирает популярность, и я расскажу о нем тоже. 
Компания Арріе перестала включать СОВ в свою среду Хсойе, но его можно уста- 
новить с помощью менеджера пакетов, например Масрог(з, Еіпк или Нотебгем. 
В Мас сеансы отладки, возможно, придется запускать через зи4о(!), например $190 
1140 ѕёадеу руддед. , 

Быть может, вы работаете в ШЕ или другой графической среде, которая запуска- 
ет вашу программу под отладчиком всякий раз, как вы выбираете из меню коман- 
ду «Выполнить». Я буду демонстрировать только работу из командной строки, по 


' Из письма Торвальдса к коллеге от 6 сентября 2000 года. 

2 Кстати, компилятор С++ подправляет (тап#е) имена функций. В СОВ это видно, н я 
всегда считал отладку кода на С++ в СОВ мучительным делом. Но компилятор С ничего 
подобного не делает, поэтому для него с СОВ работать куда проще, и пе нужны вспомо- 
гательные средства для восстановления имени в исходном виде. 
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вряд ли вас затруднит перевод команд на язык щелчков мышью. Некоторые графи- 
ческие фасады позволяют использовать макросы, определенные в файле 206їпіг. 

При работе непосредственно с командной строкой вам, возможно, будет удобно 
видеть код в текстовом редакторе в соседнем открытом окне или на другом тер- 
мцнале. Простая комбинация отладчика с редактором дает многие преимущества 
ШЕ и, может статься, больше вам ничего и не понадобится. 


Стек кадров 


Для запуска программы необходимо попросить систему выполнить функцию па1п. 
Компьютер генерирует кадр, в котором хранится информация о вызове функции, в том 
числе ее входные параметры (которые в случае паіп принято называть агдс и ахду) и соз- 
данные внутри нее локальные переменные. 

Допустим, что в процессе выполнения паіп вызывает функцию де! _адепез. В этот момент 
выполнение паіп приостанавливается и генерируется новый кадр для деї адепіѕ, где 
хранятся детали ее вызова. Быть может, де адепіѕ, в свою очередь, вызывает функцию 
адепЕ айдгеѕѕ, и таким образом мы получаем растущий стек кадров. Рано или поздно 
выполнение адепЕ аййгеѕѕ завершится, в этот момент ее кадр будет вытолкнут из стека, 
и возобновится выполнение дес адепіѕ. 

На вопрос «Где я нахожусь?» проще всего ответить, указав номер строки в программе, 
и иногда этого достаточно. Однако чаще вас интересует «Какя сюда попал?», и ответом 
на этот вопрос является обратная трассировка, или стек вызовов, то есть стек кадров. 
Вот пример обратной трассировки: 


#0 0х0000000000413Ьре іп адеп аддгеѕѕ (адепё потрег=312) аё айдгеѕѕеѕ.с:100 
#1 0х0000000000414806 іп деб адепёѕ () аі аайгеѕѕеѕ.с:163 
#2 0х0000000000404#96 іп таіп (агдс=1, агду=Ох7ЕЕЕЕЕЕЕе2 78) аё ааагеѕѕеѕ.с:227 


На вершине стека находится кадр 0, ана самом дне – вызов паіп, который в данный мо- 
мент находится в кадре 2 (но номер кадра будет меняться по мере роста и сокращения 
стека). Шестнадцатеричное число после номера кадра - это адрес, с которого возоб- 
новится выполнение после возврата из вызванной функции; для меня как прикладного 
программиста это только зрительный шум, я на него не обращаю внимания. Далее по- 
казаны имя функции, ее входные параметры (в случае агау это опять-таки шестнадца- 
теричный адрес) и номер строки в исходном коде. 

Если вы обнаружили, что номер дома в адресе агента (адепі аййгеѕѕ) заведомо неправи- 
лен, то, быть может, это потому, что передан неправильный номер агента (адепі потре), 
и в этом случае стоит перейти в кадр 1 и поинтересоваться, в каком состоянии нахо- 
дилась дег адепіѕ и почему получилось такое странное состояние адеп аййгеѕѕ. В зна- 
чительной мере искусство исследования программы заключается в перемещении по 
стеку и прослеживании причин и следствий между кадрами. 


Отладка программы как детективная история 


В этом разделе мы рассмотрим воображаемый сеанс вопросов и ответов с приме- 
нением СОВ или І108В. В примерах к этой книге имеется файл ѕїадеу роддей. с, 
вариант в примере 7.4 с ошибкой. Как в любом хорошем детективе, все ключи, 
необходимые для изобличения преступника, перед вами. Правильно выстроенная 
последовательность вопросов поможет исключить подозреваемых одного за дру- 
гим, пока не останется всего один и ошибка не станет очевидной. 

После компиляции программы (с помощью команды СРЬАб5="-9" паке ѕЁайеу 
роддеаӣ) приступим к расследованию и для начала запустим отладчик: 
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дар ѕеааеу риддеа 
# или 
1146 ѕёадеу Боддеа 


Перед нами приглашение к вводу команд отладчика, можно задавать вопросы. 


В. Что делает эта программа? 

О. Команда гоп запускает программу. Ее, как и все команды СРВ и І10В, мож- 
но записать в сокращенном виде: 
(905) г 
теап: 5687.496667 уаг: 194085710 


пеап: 0.83 уаг: 4.1334 
[ТпЕег1ог 1 (ргосез$ 22734) ех1%е4 погта11у] 


Похоже, программа вычисляет какие-то средние значения и дисперсии. Она до- 
шла до конца без нарушения защиты памяти и прочих ошибок и вернула нуль, что 
означает нормальное завершение. 


В. Проверяет ли код в па1п правильность результата? 

О. Посмотреть на исходный код проще всего, открыв его в текстовом редак- 
торе. Существуют способы расположить редактор рядом с отладчиком даже при 
удаленной работе на машине, оснащенной только текстовыми терминалами (см. 
врезку «Визуальные средства» на стр. 116). Но СОВ и [.ОВ тоже умеют показы- 
вать фрагменты кода, для этого служит команда 1151: 


(945) 1 таіп 

28 } 

29 геригп (теапуаг) {.теап = ауд, 

30 .маг = ауд2 - ром (ауд, 2)}; //Е[х^2] - Е^2 [х] 
31 } 

32 

33 іп таіп () { 

34 аоџь1е 4[] = { 34124.75, 34124.48, 

35 34124.90, 34125.31, 

36 34125.05, 34124.98, МАМ}; 
37 


Выведено десять строк программы выше и ниже запрошенной. При повторном 
выполнении команды 115+ без аргументов будут выведены следующие 10 строк: 


(ҹар) 1 

38 пеапуаг ту = теап апа уа (а); 

39 ргіпёё ("тмеап:%.109 уаг:%.109\п", ту.теап, ту. уаг*6/5.); 
40 

41 ЧочЬ1е 42[] = { 4.75, 4.48, 

42 4.90, 5.31, 

43 5.05, 4.98, МАМ}; 

44 

45 ту = теап апа уаг (42); 

46 пу.маг *= 6./5; 


47 ргіпеё ("теап:%.109 уаг:%.109\п", ту.теап, ту. чаг); 
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В строке 38 мы видим обращение к функции пеап апі таг, которой передает- 
ся список 49. И тут, очевидно, имеет место проблема: все числа в 4 расположены 
в окрестности 34 125, а напечатанное программой среднее значение приближенно 
равно 5687 (не говоря уже о какой-то несуразной дисперсии). Аналогично при 
втором обращении функции пеап апа уаг передается список чисел в окрестности 
5, а среднее оказалось равно 0.83. 

Вся оставшаяся часть сеанса посвящена поиску ответа наединственный вопрос: 
где то первое место в программе, начиная с которого все пошло наперекосяк? Но 
чтобы ответить на этот главный вопрос, нам нужны дополнительные детали. 


В. Как узнать, что происходит внутри пеап апд_уаг? 
О. Мы хотим приостановить программу при входе в пеап апа уаг, чтобы поста- 
вить там точку останова: 


(945) Ь теап апа маг 
Вгеакроіпе 1 аб 0х400820: Н1е зЕа4еу_БоддеЯ.с, 11пе 16. 


Поставив точку останова, заново запустим программу - она остановится в этой 
точке: 


(945) г 

Вгеакроіпё 1, теап апа уаг (дака=Чдака@епегу=Ох7ЕЕЕЕЕЕЕе130) ас 
ѕсааеу Броддеа.с:16 

16 теапуаг теап апа уаг (сопѕё Яоџр1е *ааѓа) { 

(ар) 


Сейчас мы стоим в строке 16, в самом начале функции, и можем задавать даль- 
нейшие вопросы о том, что в ней происходит. 


В. В переменной іаѓа находится то, что мы думаем? 
О. Посмотреть на переменную Паѓа в текущем кадре позволяет команда ргіпё, 
сокращенно р: 


(946) р *ааѓба 
$2 = 34124.75 


Печально — нам показали только первый элемент. Однако в СРВ имеется спе- 
циальная конструкция #- для печати последовательности элементов массива. Вот 
как запросить первые 10 элементов [11.08В: тет геаа -{Чо\Ы]е -с10 Чака]: 


(90) р *Ч4ака@10 

$3 = {34124.75, 
34124.480000000003, 
34124.900000000001, 
34125.309999999998, 
34125.050000000003, 
34124.980000000003, 
пап (0х8000000000000), 
7.7074240751234461е-322, 
4.9406564584124654е-324, 
2.0734299798669383е-317} 
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Обратите внимание на звездочку в начале выражения, без нее мы получили бы 
последовательность из десяти шестнадцатеричных адресов. 

Я запросил 10 элементов, потому что было лень считать, сколько элементов хра- 
нится в наборе данных, но первые семь из десяти выглядят правильно: последо- 
вательность чисел, в конце которой находится маркер МаМ. После него мы видим 
мусор – неинициализированную память за концом массива. 


В. Соответствует ли это тому, что мы передали из паіп? 
О. Команда бї печатает обратную трассировку: 
(даь) Бе 


#0 теап апа уаг (даёа=даќаҝепігу=0х7#ЁЁҒЕҒҒе130) ас зЕ44еу риддеа.с:16 
#1 0х0000000000400680 іп таіп () аё ѕеадеу Боддеа.с:38 


В стеке находятся всего два кадра: текущий и вызвавший его, па1п. Посмотрим 
на данные в кадре 1 и для начала переключимся на него: 
(аЬ) Е 1 


#1 0х0000000000400680 іп таіп () а зЕ44еу_Руддеа.с:38 
38 теапуаг ту = теап апа хаг (а); 


Сейчас отладчик находится в кадре функции паіп, в строке 38. Это ожидаемое 
место, так что порядок выполнения правильный (и не изменен оптимизатором). 
Находясь в этом кадре, посмотрим на массив данных с именем 1: 

(ҹар) р *ае@7 
$5 = (34124.75, 

34124.480000000003, 

34124.900000000001, 

34125.309999999998, 

34125.050000000003, 

34124.980000000003, 

пап (0х8000000000000) } 


Данные совпадают с теми, что мы видели в кадре пеап_ап4_уаг, так что с набором 
данных вроде бы ничего странного не произошло. 

Нам нет необходимости явно возвращаться в кадр 0, чтобы продолжить выпол- 
нение программы, но это можно было бы сделать командой Ё 0 или командой пере- 
мещения по стеку относительно текущего кадра: 


(345) аомп 


Отметим, что в командах пр и домп предполагается числовой порядок. Если счи- 
тать, что в списке, который выводит Бї (как в СОВ, так и в Г.Г.) В), кадр с наи- 
меньшим номером располагается сверху, то ир идет вниз, а домп вверх по списку 
обратной трассировки. 


В. Эта проблема случайно не связана с параллельными потоками? 
О. Получить список потоков позволяет команда 1пЁ0 іћгеайѕ [Т.Г.ОВ: Вгеаа 1154 |: 


(346) 1пЁЕо Еһгеааѕ 
Іа Тагдеё та Егате 
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* 1 Тһгеаа Ох7ЕЕЕЕТЕСЬ7с0 (МР 28903) "ѕедаеу Ьиддеа" теап апа уаг 
(дДаса=дасаҝепігу=0х7 ЕЕЕЕЕЕЕе180) ас зЕ44еу_БуддеЯ.с:16 


В данном случае существует всего один активный поток, поэтому проблема ни- 
как не может быть связана с многопоточностью. Символ * показывает, в каком 
потоке сейчас находится отладчик. Если бы существовал поток 2, то мы могли бы 
Пери в него командой їћгеаа 2 (СОВ) или ёћгеаа ѕе]есї 2 (110В). 

у Если до сих пор вы в своих программах не запускали несколько потоков, то после про- 
\/ чтения главы 12 ситуация обязательно изменится. Пользователям СОВ рекомендуется 


добавить в файл .д0ріпії показанную ниже команду, чтобы отключить надоедливые уве- 
домления о каждом создании нового потока: 


зеЁ рг1пЕ ёһгеаа-еуепёѕ ої# 


В. Что делает функция пеап_ап4 уаг? 
О. Мы можем пройти функцию в пошаговом режиме, повторно выполняя сле- 
дующую команду: 


(945) п 

18 ау92 = 0; 

(ар) п 

16 теапуаг теап апа уаг (сопзі доџр1е *4ака) { 


Простое нажатие клавиши Епќег повторяет предыдущую команду, так что даже 
букву п вводить необязательно: 


(аар) 

18 ау92 = 0; 

(аар) 

20 ѕіғе Е соџпё= 0; 

(ар) 

16 теапуаг теап апа уаг (сопѕі аоџр1е *Чака) { 
(аар) 

21 Рог (ѕіғе ё 1=0; !іѕпап (даба ([1]); 1++) { 
(аар) 

21 Еог (ѕіғге © 1=0; !іѕпап (даба [1]); 1++) { 
(аар) 

22 гаёіо = соцпё/ (соцпё+1); 

(аар) 

26 ауд += даба [і] / (сооп +0.0); 


Номера строк показывают, что программа выполняется не последовательно. 
Объясняется это тем, что на каждом шаге отладчик выполняет машинные коман- 
ды, которые необязательно точно соответствуют коду на С, из которого сгенери- 
рованы. Это нормально даже в случае, когда уровень оптимизации равен нулю. 
Переходы могут также отражаться на переменных - их значения ненадежны до 
момента выполнения второй или третьей строки после той, что выбивается из 
общего порядка. 

Существуют и другие способы пошагового выполнения, чаще всего использу- 
ются команды $, п, и, с (см. таблицу ниже). Однако на такой проход по программе 
может уйти весь день. Мы видим, что обход массива даа производится в цикле Гог, 
так давайте поставим еще одну точку останова внутри этого цикла: 
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(ар) Ь 25 
Вгеакроіпі 2 аё 0х400875: й1е зЕ4деу Буддеа.с, 11пе 25. 


Теперь у нас есть две точки останова, их можно посмотреть командой іпѓо ргеак 
(СОВ) или Бгеак 1151 (1108В): 


(9а6) 1пЕо Ьргеак 
Мот Туре ріѕр ЕпЬ Адйгеѕѕ Ивае 
у бгеакроіпё Кеер у 0х0000000000400820 іп теап апа чаг 
ас ѕіааеу роддей.с:16 
РгеаКро1пЕ а1геаду һії 1 біте 
2 бгеакроіпі Кеер у 0х0000000000400875 іп теап апа уаг 
аё ѕсадеу Боддей.с:25 


Точка останова в начале функции птеап апа _уаг нам больше не нужна, поэтому 
деактивируем ее [1108В: Бгеак 915 1]: 


(945) із 1 


После этого в столбце Епр таблицы, печатаемой командой іпѓо ргеак, для точки 
останова 1 будет стоять п. Впоследствии точку останова можно реактивировать 
командой епар1е 1 (СОВ) или ргеак елађ1е 1 (1108В). А если вы точно знасте, что 
точка останова больше не понадобится, то ее можно вообще удалить командой 4е1 
1 (СОВ) или Бгеак ае] 1 (11.08). 


В. Какие значения имеют переменные внутри цикла? 

О. Можно начать выполнение программы с самого начала командой г или про- 
должить с места, где мы остановились, командой с: 
(чар) с 
Вгеакроіпё 2, теап апа уаг (даса=даёсаҝепёгу=0х7#ЁЁЁҒҒҒе130) аб 


ѕсадеу Бџадеа.с:25 
25 ау92 *= гаііо; 


Сейчас мы остановились в строке 25 и можем просмотреть все локальные пере- 
менные [11.08В: Ғгате уаг1а 1 е]: 


(345) 1пЕо 1оса1 


1=0 

ауд = 0 
ау92 = 0 
гаќіо = 0 
сооп = 1 


Можно также проверить входные аргументы функции с помощью команды 
СОВ 110 агдз, хотя ранее мы уже и так выводили массив йаќа. Команда 1. ОВ 
Ғгапе уаг1аЪ]е выводит как локальные переменные, так и входные аргументы. 


В. Мы знаем, что выведенное среднее неправильно, а как изменяется пере- 
менная ауд на каждой итерации цикла? 

О. Можно было бы выполнять команду р ауд при каждом попадании в точку 
останова, но этот процесс можно автоматизировать с помощью команды 1і5р1ау: 
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(945) аіѕр ауд 
1: ауд = 0 


Теперь, когда мы продолжим выполнение, отладчик будет крутиться в цикле и 
каждый раз в точке останова печатать текущее значение ауд: 
(ар) с 
Вгеакроіпё 2, теап апа уаг (дафха=Чаха@епегу=Ох7ЕЕЕЕЕЕЕе130) ас зЕааеу_Буддеа.с:25 
ия ауд2 *= га®1о; 
1: ауд = 0 


(чар) 

Вгеакроіпё 2, теап апа уаг (даїа=даёаҝепігу=0х7#ЁҒЁҒҒҒе130) аї ѕадеу роддеа.с:25 
25 а\92 *= гаііо; 

1: ауд = 0 


Плохой знак: в программе есть строки 


ауд *= гаііо; 
ауд += ааба [1] / (сопе +0.0); 


поэтому ау должна бы изменяться на каждой итерации, но она как была равна 
пулю, так и остается. Установив, что это ошибка, мы можем больше не отвлекаться 
на переменную ауд (которая в списке команды 915р1ау значится под номером 1) и 
отменить ее автоматическую печать командой џпӣіѕр 1. 


В. Чему равны переменные, используемые при вычислении ауд? 
О. Мы уже убедились, что с дака все в порядке, а как насчет гаїіо и сошпі? 


(ар) аіѕр габіо 
2: гаїіо = 0 


(аю) аіѕр сооп 
3: соџпё = 3 


Выполнив еще несколько итераций цикла, мы увидим, что сооп, как и положе- 
но счетчику, каждый раз увеличивается на 1, авот гаѓіо не изменяется: 


(ар) с 

Вгеакроіпё 2, теап апа уаг (дака=Чдакайепегу=Ох7ЕЕЕЕЕЕЕе130) аб 
ѕсааеу Боддеа.с:25 

25 а\92 *= гаііо; 

3: соџпё = 4 

2: габіо = 0 


и 


В. Где присваивается значение гаёіо? 
О. Посмотрев код в текстовом редакторе или командой 1, мы увидим, что пере- 
менной га{1о присваивается значение только в строке 22: 


гаііо = соипё/ (соипЕ+1); 


Мы уже убедились, что соџпі увеличивается, но что-то же в этой строке непра- 
вильно. И сейчас должно быть понятно, что именно: если соџі целое число, то 
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в выражении соџпї/ (соџпі+1) применяется целочисленное деление и, стало быть, 
возвращается целое число (3/4==0), хотя должна бы выполняться операция де- 
ления чисел с плавающей точкой, хорошо нам известная со школьной скамьи 
(3/4==0.75). Чтобы получить правильный результат (см. раздел «Меньше приве- 
дений» на стр. 157), нужно сделать так, чтобы либо числитель, либо знаменатель 
был числом с плавающей точкой. Для этого достаточно заменить целую коистанту 
1 константой с плавающей точкой 1.0: 


габіо = соопі/ (соопі+1.0); 


Отладчик не предупредил нас об этой распространенной ошибке, но помог 
отыскать то место в программе, где что-то впервые пошло не так, и, безусловно, 
найти ошибку в одной строке проще, чем во фрагменте из 50 строк. Попутно мы 
получили возможность проверить разнообразные аспекты поведения программы 
и лучше понять порядок ее выполнения и структуру стека кадров. 

Ниже приведен список наиболее употребительных команд отладчика. И в СЭВ, 
ив І1.РЮВ команд гораздо больше, но показанные ниже - это те 10%, которые ис- 
пользуются в 90% случаев. Имена переменных по большей части взяты из про- 
граммы скачивания заголовков газеты «Нью-Йорк таймс», описанной в разделе 
«ШЬхті и сОВГ» ниже. 


Таблица 2.1 %* 


Группа Команда Назначение 
| Запуск | гоп | Запустить программу с начала | 
гип агдѕ Запустить программу с начала с указанными 
аргументами в командной строке 
| Останов | рде гѕѕ | Приостановить выполнение в начале функции | 
р пуё Еее4$.с:105 Приостановить выполнение перед указанной 
строкой 
ргеак 105 То же, что р пу Ёеейѕ.с:105, если мы уже 
остановились в файле пүі Ёѓеейѕ.с 
іпёо ргеак [@08В] Вывести список точек останова 
ргеак бгеак [Ш.0В] 
масс сиг] [@ОВ] Остановиться, если значение указанной 
маёсћ зеё уаг сиг1 [ШОВ] переменной изменилось 


915 3 / епа 3 / де1 3 [60В] Деактивировать/реактивировать/удалить точку 
ргеак 915 3 / ргеак епа 3 / реак | останова 3. Если точек останова много, то мож- 
де] 3 [08] но деактивировать все командой йі ѕар1е без 
параметров, а затем активировать одну-две, 
нужные в данный момент; то же относится 

к командам епаріе и йе1еѓе 


Напечатать значение переменной иг]. Можно 
задать любое выражение, в том числе содер- 
жащее вызов функции 


Напечатать первые десять элементов массива 


ап аггау. Для печати следующих десяти эле- 
ментов выполните команду * (ап аггау+10) 010 


Просмотр 
переменных 


р *ап аггауё10 [СОВ] 
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Таблица 2.1 * (окончание) 
Группа Команда Назначение 


пет геаа -ЕЧоцЫе -с10 Прочитать 10 элементов типа їоџр1е из масси- 
ап аггау ва ап аггау. Для чтения следующих десяти 
элементов выполните команду пеп геай 
-саоџр]е -с10 ап аггау+10 


іпЁо агдѕ / іпЁо уагз [60В] Получить значения аргументов функции 

Ғтапе уаг [ОВ] или всехлокальных переменных 

91$р иг1 Печатать значение иг] при каждом останове 
программы 


упаіѕр 3 Прекратить печать переменной с порядковым 
номером 3. СОВ: если номер не указан, 
перестают печататься значения всех 


переменных 


Потоки іпЁо ёћгеаа [С0В] Вывести список активных потоков 
Ећгеаа 115 [Ш ОВ] 
Ећгеаа 2 [@08В] Переключиться на поток 2 
{Вгеад ѕе]есі 2 [1 ОВ] 
| Кадры | ре | Вывести стек кадров | 
ЕЗ Показать кадр 3 
ур / домп Перейти на кадр с номером, на единицу у 
большим или меньшим текущего 
Пошаговое [5 Шаг на одну строку, даже если она находится 
выполнение в другой функции 
П Перейти к следующей строке, но не заходить 
внутрь функции 
ц Вперед до следующей строки, считая 


от текущей (поэтому на повторных итерациях 
текущего цикла останова не происходит, 
программа останавливается на строке, 
следующей за циклом) 


с Продолжить до следующей точки останова 
или до завершения программы 
геї или геї 3 [20В] Немедленно выйти из текущей функции, вернув 


указанное значение (если оно задано) 


ограничениями) строке 
Напечатать 10 строк, окружающих текущую 


| р 105 [008] 


Перейти к произвольной (с разумными | 


кода 


Повтор Клавиша Ещег Нажатие клавиши Ет{ег без ввода каких-либо 
данных приводит к повтору последней 
команды, что упрощает пошаговое 
выполнение. Если последней командой была 1, 
то печатаются следующие 10 строк 


Компиляция | паке [СОВ] Запустить паке, не выходя из ОРОВ. 
Можно также указать цель, например: 
паке тургод 


Справка ће1р Посмотреть, что предлагает отладчик 


Просмотр | 1 
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Переменные СОВ 


В этом разделе мы рассмотрим некоторые полезные возможности отладчика, по- 
зволяющие просматривать данные с максимальными удобствами. Все описывае- 
мые команды выполняются из командной строки; встроенные в ШЕ отладчики 
на основе СРВ часто предлагают средства для встраивания их в собственный ин- 
терфейс. 

Ниже приведен пример программы, которая не делает ничего полезного, но 
в ней есть переменная, которую можно опросить. Поскольку это программа-пус- 
тышка, не забудьте при компиляции задать флаг отключения оптимизации -00, 
иначе от переменной х не останется никаких следов. 


106 таіп() { 
116 х[20] = {}; 
х[0] = 3; 


Первый совет покажется новым только тем, кто не читал руководства по СОВ 
[5атар 2002], и есть подозрение, что это вы все. Чтобы меньше нажимать кла- 
виши, можно завести вспомогательные переменные. Например, чтобы опросить 
элемент, до которого нужно долго добираться по цепочке структур, можно посту- 
пить следующим образом: 


(945) зеф $уа = ту тоде1->дӢасаѕеб->месёог->даёа 
р *$\а6в10 


(1146) р доџр1е *$у4 = ту тоде1->дӢаёаѕес->уесіог->ӣаѓа 
пет геаа -Е4оиЬ1е -с10 $уа 


В первой строке создается вспомогательная переменная, вместо которой под- 
ставляется длинный путь. Как и в оболочке, переменные обозначаются знаком 
доллара. Но, в отличие от оболочки, в СРВ при первом определении переменной 
используются команда 5е{ и знак доллара, а в І10В - синтаксический апализа- 
тор С!апё для вычисления выражений, поэтому объявление в 1.1.) В синтаксиче- 
ски ничем не отличается от обычного объявления в С. Во второй строке в обоих 
случаях демонстрируется пример использования. Здесь мы несильно сэкономили 
на количестве ударов по клавишам, но если вы подозреваете некую переменную 
в ошибке, то наличие у нее короткого имени ускорит ввод команд опроса. 

Но это не просто имена, а настоящие переменные, которые можно изменять. 
Остановившись в третьей или четвертой строке этой программы-пустышки, по- 
пробуйте ввести такие команды: 

(345) зеё $рег=ёх[3] 
р *$ріг = 8 
р *($рЕг++) # напечатать то, на что ведет указатель, и продвинуться на следующий элемент 


(1146) р 1пЕ *$рёг = &х[3] 
р *$рёг = 8 
р * ($ріг++) 
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Команда во второй строке изменяет значение по указанному адресу. Увеличе- 
ние указателя на единицу сдвигает указатель на следующий элемент списка (как 
описано в разделе «Все, что нужно знать об арифметике указателей» на стр. 148), 
поэтому после выполнения третьей строки $р\г указывает на х [4]. 

Последняя форма особенно удобна, потому что нажатие клавиши Ещег без 
ввода данных повторяет последнюю команду. Поскольку указатель продвигается 
вперед, при каждом нажатии Епќег мы будем получать новое значение, пока не 
переберем всего массива. Это полезно также при обходе связанного списка. Пред- 
ставьте, что имеется функция ѕћон ѕігисїџге, которая отображает элемент связан- 
ного списка и устанавливает переменную $1154 равной текущему элементу. Пусть 
также указатель на начало списка хранится в переменной 115 ћеаӣ. Если выпол- 
нить команду 


р $115%=11$Е Неаа 
звом_эЕгисбиге $113&->пехе 


а затем просто нажимать Ещег, то мы обойдем весь список. Ниже мы воплотим 
в жизнь идею воображаемой функции для показа структуры данных. 

Но сначала рассмотрим еще один прием работы с $-переменными. Позволю себе 
скопировать пару строк из сеанса работы с отладчиком на другом экране: 


(9951114) р х+3 
$17 = (116 *) ОхЬЕЕЕЕЭда4 


Обратите внимание, что результат, выведенный командой печати, начинается 
с 517. На самом деле каждый выведенный результат присваивается переменной, 
которую можно использовать как любую другую: 


(99511146) р *$17 


$18 = 8 
(94611145) р *$17+20 
$19 = 28 


Более того, в СОВ переменной с именем $ присваивается последний выве- 
денный результат. Поэтому если вы получили некий шестнадцатеричный адрес, 
то для печати хранящегося по этому адресу значения нужно просто выполнить 
команду р *$. Таким образом, показанные выше шаги можно было записать так: 
(ар) р х+3 
$20 = (11% *) ОХЬЕЕЕЕ9а4 
(946) р *$ 
$21 =8 
(ар) р $+20 
522 = 28 


Распечатка структур 


Можно определять простые макросы, что особенно полезно для отображения 
нетривиальных структур данных - а именно ради этого мы чаще всего и работа- 
ем с отладчиком. Даже простой двумерный массив режет глаз, если вывести его 
в виде длинной строки чисел. В идеальном мире для каждой структуры данных 
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существовала бы отдельная команда отладчика, позволяющая распечатать се в 
наиболее удобном виде (или разных видах). 

Но, быть может, у вас уже есть С-функция, которая распечатывает сложную 
структуру, встречающуюся в программе. Тогда можно написать макрос, который 
просто вызовет эту функцию. Средство довольно примитивное, но удобное. 

В отладчике невозможно воспользоваться макросами препроцессора С, пото- 
му что они расширяются задолго до того, как отладчик видит вашу программу. 
Поэтому если в программе имеются полезные макросы, то их придется повторно 
реализовать в отладчике. 

Ниже показана функция СОВ, которую можно испытать, поставив точку оста- 
нова в том месте функции рагзе, описанной в разделе «ПЬхш] и сОКІ» настр. 334, 
где имеется структура 40с, представляющая дерево ХМГ-документа. Поместите 
следующие макросы в файл .ддріпії. 
аеѓіпе рхп1 

р хп1Е1етритр (з3ЕЧ4о0е, $ага0, хт1росбеКооёЕ1етепё ($ага0) ) 
епа 
аоситепё рхт1 
Распечатать на экране дерево уже открытого ХМІ-документа (к примеру, хт1росРёг). Ско- 
рее всего, распечатка займет несколько страниц. 

Например, если дано: хт1росРг ос = хм1РагзеЕ11е (іпі1е); 


то следует написать: рхт1 4ос 
епа 


Обратите внимание, что документация находится сразу после самой функции; 
просмотреть ее можно с помощью команды ће1р рхп1 или ће1р изег-дейлед. Макрос 
экономит всего несколько нажатий клавиш, но поскольку работа с отладчиком 
сводится в основном к просмотру данных, эта экономия суммируется. 

Варианты этих макросов для І1.0В я покажу позже. 

В библиотеке СТ4Ь имеется структура связанного списка, поэтому хотелось бы 
иметь средство просмотра такого списка. В примере 2.1 оно реализовано в виде 
двух доступных пользователю макросов (рНеа@ для просмотра начала списка и 
рпехі для перехода к следующему элементу) и одного макроса, которого пользова- 
тель вызывать не должен (р1іѕёдаѓа – для устранения избыточности при реализа- 
ции рћеааи рпех+). 


Пример 2.1 < Набор макросов для отображения связанного списка в ООВ – 
пожалуй, ничего сложнее этого отладочного макроса вам никогда не понадобится 
(оао ѕһомііѕї) 


аейпе рпеаа 
зеё $рёг = $агд1 
р1іѕбааба $агд0 
епа 
ЧоситепЕ рћеаа 
Напечатать первый элемент списка. Если имеется объявление 
6115Е *дӢаба115ѕі; 
9_11ѕі ааа (дӢаба1ізѕі, "Не110"); 
то для просмотра списка можно использовать такие команды: 
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9аб> рһеаа сһаг Ча*а11$% 

даб> рпехЕ сһаг 

9ар> рпехЕ сһаг 

В этом макросе $рёг - указатель на текущий элемент списка, а $рдака - 
данные, хранящиеся в этом элементе. 

епа 


аейпе рпехі 

зее $рёг = $рёг->пехё 

р115ЕЧаба $агд0 
епа 
аоситепё рпехе 
Сначала необходимо вызвать рћеай; при этом устанавливается $ріг. 
Этот макрос переходит к следующему элементу списка и показывает хранящееся 
в нем значение. Единственным аргументом должен быть тип данных в списке. 
В этом макросе $рёг - указатель на текущий элемент списка, а $рдака - 
данные, хранящиеся в этом элементе. 
епа 


Чейпе р1іѕёааба 
1Е $рїг 
зее $раӢаба = $рёг->ааба 
е1ѕе 
ѕе $рааба= 0 
епа 
іЁ $рааса 
р ($агд0*) $раӢаса 
е1ѕе 
р "МО" 
епа 
епа 
аоситепё р1іѕёааба 
Предназначен для вызова из рћеаа и рпехе, см. выше. Устанавливает 
переменную $рдӢаќа и печатает ее значение. 
епа 


В примере 2.2 приведен пример кода, в котором в списке 6115 хранятся данные 
типа сћаг *з. Можете поставить точки останова перед строкой 8 и после строки 9 и 


вызвать в них показанные выше макросы. 


Пример 2.2 * Пример кода для экспериментов с отладкой. Можно рассматривать 


как сверхкраткое введение в связанные списки из библиотеки Ср (91$1.с) 


#іпс1іџае <5аіо.һ> 
#іпс1џае <9116.һ> 


Сііѕі *11іѕі; 


іп таіп() { 
1156 = 9 1156 аррепа(1іѕё, "а"); 


115 = 9 1156 аррепа (11$, "Ь"); 
1156 = 9 115 аррепа(1іѕё, "с"); 
Ғог ( ; 1іѕё!= МО; 11$6=11$&->пехё) 


ргіпі# ("%5\п", (сһаг*) 1іѕе->ааќѓа); 


Я 


< Часть | Окружение 


` Можно определить функции, которые будут выполняться до или после каждого использо- 
вания некоторой команды. Например, команды (СОВ): 


аейпе һоок-ргіпё 
есһо <----\п 
епа 


аеѓіпе һоокроѕі-ргіпё 
есһо ---->\п 
епа 


будут выводить специального вида скобки дои после любого напечатанного значения. Са- 
мая интересная точка подключения – ћоок-ѕіор. Команда 415р1ау печатаетзначениепро- 
извольного выражения при каждом останове программы, но если вы хотите при каждом 
останове выполнять некоторый макрос или какую-нибудь другую команду ООВ, то пере- 
определите макрос Воок-5%ор: 


аейпе һоок-ѕёор 
рхт1 зизресе ёгее 
епа 


После того как возникшие подозрения проверены, восстановите стандартное поведение: 


аейпе һоок-ѕёор 
епа 


Для пользователей ШОВ: см. Сагде ѕїор-ћоок аай. 
\ Ваша очередь. Макросы СОВ могут включать также команду ићі1е, которая очень похожа 


на команды і# из примера 2.1 (в начале строка вида $рїх, а в конце епа). Воспользуйтесь 
ей, чтобы написать макрос, который выводит сразу весь список. 


В ИОВ все это делается немного иначе. 

Во-первых, как вы, наверное, заметили, команды І1.0В довольно многослов- 
ны, потому что авторы ожидают, что для наиболее часто используемых команд вы 
сами напишете псевдонимы. Например, вот как можно было бы написать псевдо- 
нимы для команд печати массивов типа доц ]е или іпі: 


(1145) соттапа а11аз ар тетогу геаа -ЕаочЬ1е -с%1 
соттапа а11аз ір метогу геаа -+1пе -с%1 


# Примеры использования: 
ар 10 ааба 
ір 10 ідаѓа 


Механизм псевдонимов предназначен для сокращенной записи существующих 
команд. Не существует способа назначить псевдониму команды строку справки, 
поскольку І1.0В пользуется справкой, ассоциированной с исходной командой. 
Для написания макросов, аналогичных показанным выше макросам СРВ, в 1..0 В 
применяются регулярные выражения. 

Вот версия для Г.Г.ОВ, которую можно поместить в файл .11451п1: 
соттапа гедех рхп1 


'5/(.+)/р хм1Е1етритр (ѕаооё, %1, хм1РосбееВоо%{Е1етепе (%1) 0) /' 
-В "Бимр Єһће сопёепеЁз оЁ ап ХМІ +гее." 


Подробное обсуждение регулярных выражений выходит за рамки этой книги 
(в Сетиможнонайти сотни пособий по регулярным выражениям). Отметим лишь, 
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что содержимое строки между первой и второй косой чертой будет подставлено 
вместо маркера%1, встречающегося между второй и третьей косой чертой. 


Профилирование 


Как бы быстро ни работала программа, всегда хочется, чтобы она была еще быстрее. 
В большинстве языков сразу дают совет: переписывайте все на С. Но мы-то и так уже 
пишем на С. Следующий шаг - найти функции, на которые уходит больше всего време- 
ни, их оптимизация даст наибольший эффект. 

Прежде всего включите в переменную СЕ1Аб5 для асс или ісс флаг -рд (действие этого 
флага зависит от компилятора; дсс подготовит программу для работы с дрго+, а ком- 
пилятор 1п{е! – для работы с рго+, в остальном порядок действий аналогичен, поэтому я 
ограничусь только деталями для асс). Программа, откомпилированная с этим флагом, 
будет приостанавливаться каждые несколько микросекунд и смотреть, в какой функции 
она сейчас находится. Эта информация записывается в двоичном формате в файл дпоп. 
ош. 

Профилируется только сам исполняемый файл, но не скомпонованные с ним библиоте- 
ки. Поэтому если необходимо профилировать также библиотеку при исполнении тесто- 
вой программы, то придется скопировать код программы и библиотеки в одно место, 
а затем перекомпилировать их и собрать в один большой исполняемый файл. 

После прогона программы выполните команду одроѓ уоцг ргодгам > ргоћ1е (или рої ..), за- 
тем откройте файл рго 1е в текстовом редакторе, вы увидите список функций с указани- 
ем места, откуда они вызывались, и доли времени, проведенной программой в каждой 
функции. Возможно, информация о том, где в программе узкие места, станет для вас 
неожиданностью. 


Использование \аідгіпа для поиска ошибок 


При работе с отладчиком большая часть времени уходит на поиск места, где про- 
грамма впервые начинает вести себя подозрительно. Хорошая система сама най- 
дет это место. Иными словами, в хорошей системе программа быстро «грохнется». 

Язык С в этом отношении противоречив. В некоторых языках опечатка вида 
сопиё=15 просто приведет к созданию новой переменной, не имеющей ничего обще- 
го с переменной сооп, которую вы имели в виду; в С этобудетобнаружено на этапе 
компиляции. С другой стороны, С позволит присвоить значение десятому элемен- 
ту массива, содержащего всего 9 элементов, и долго еще будет радостно работать, 
пока вы не обнаружите, что там, где, по вашему мнению, должен был находиться 
элемент 10, на самом деле мусор. 

Подобные проблемы с управлением памятью вызывают много хлопот, и потому 
существуют инструменты для борьбы с ними. И на одном из первых мест стоит 
Уа]егіпа. Это средство перенесено на большую часть РОЅІХ -совместимых систем 
(включая ОЗ Х), и установить его можно с помощью менеджера пакетов. А поль- 
зователи УЛп4до\з могут поэкспериментировать с программой Ог. Метогу. 

Уа]егіпа запускает виртуальную машину, которая лучше следит за использова- 
нием памяти, чем реальная, и потому знает, что вы обратились к десятому элемен- 
ту массива, в котором всего 9 элементов. 

Откомпилировав программу (в сс и СІапе, разумеется, с флагом -д для вклю- 
чепия отладочных символов), выполните команду: 


уа1дгіпа уоог ргодгат 
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При наличии ошибки Уа|егт выведет две обратные трассировки, очень по- 
хожие на те, что выводит отладчик. Первая указывает на место, где впервые было 
обнаружено некорректное использование, а второе — гипотеза Уа]егіпа о том, 
в какой строке находится предложение, послужившее причиной ошибки, на- 
пример где было произведено двойное освобождение одной и той же области 
памяти или где находится ближайшая операция выделения памяти с помощью 
па11ос. Ошибки нередко бывают весьма тонкими, но информация о том, на какую 
строку обратить внимание в первую очередь, сильно сокращает время их поис- 
ка. Уаіегіпа активно развивается – программисты ничего так не любят, как пи- 
сать инструменты разработки, - я с удовольствием наблюдаю, насколько более 
информативными стали со временем отчеты, и ожидаю дальнейших улучшений 
в будущем. 

Чтобы вы могли составить представление об обратной трассировке Узегп4, я 
внес ошибку в код примера 9.1, дважды повторив строку 14, Ёгее (сті), в результате 
чего память, на которую указывает спа, освобождена дважды. 

Іпуа1іа Егее() / е1ебе / ае1ефе[] / геа11ос () 
ас Ох4АО7ЭАЕ: Егее (уд_гер1асе_та11ос.с:427) 
ру 0х40084В: дес ѕігіпдѕ (5а4$Ег1п95.с:15) 
ру 0х40086В: таіп (ѕайѕёгіпдѕ.с:19) 
Ааагеѕѕ 0х4с36090 1$ 0 Ьубсеѕ іпѕіде а Ь1оск оЁ $12е 19 Егее'а 
ас Ох4А079АЕ: Егее (уд гер1іасе та110ос.с:427) 


ру 0х40083Е: де эігіпдѕ (ѕааѕёгіпдѕ.с:14) 
ру 0х40086В: таіп (ѕааѕёгіпдѕ.с:19) 


Верхний кадр в обеих трассах – это библиотечный код освобождения памяти, 
но мы уверены, что стандартная библиотека отлажена хорошо. Перенеся внима- 
ние на ту часть стека, которая относится к написанному мной коду, я вижу, что 
трасса указывает на строки 14 и 15 в файле ѕадѕігіпдѕ.с, где действительно нахо- 
дятся оба обращения к Ёгее (спа). 

( Маідгіпа отлично находит условные переходы, зависящие от неинициализированных зна- 
„„/ чений. Попробуйте вставить в свою программутакой код: 
1Е(зизресе уаг) рг1пЕЁ(" "); 
и посмотрите, что Маідгіпа скажет о переменной ѕиѕресі чаг. 


Можно также при обнаружении первой ошибки запустить отладчик: 
уа1дгіпа --ар-аёёасһ=уеѕ уоиг ргодгат 

В этом случае при обнаружении каждой ошибки программа будет спрашивать, 
хотите ли вы запускать отладчик, после чего вы сможете как обычно проверить 


значения подозрительных переменных. 
Уа]егіпа умеет также обнаруживать утечки памяти: 


уа19г1па --Іеак-сһеск=#џ11 уоиг ргодгат 
Работа в подобном режиме обычно медленнее, поэтому так запускать програм- 


му каждый раз не стоит. По завершении вы получите обратную трассировку для 
каждого места, в котором была выделена память, впоследствии не освобожденная. 
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В некоторых ситуациях охота за утечками может занять очень много времени. 
Утечка в библиотечной функции, вызываемой миллион раз в цикле, или в про- 
грамме, которая должна безостановочно работать месяцами, в конечном итоге соз- 
даст серьезные проблемы пользователям. Впрочем, нетрудно отыскать програм- 
мы, которые считаются вполне надежными (на моей машине это 4охуреп, ріс, ТеХ, 
уі и многие другие), и при этом Уатта сообщает об утечках в несколько кило- 
байтов. В таких случаях стоит вспомнить философскую загадку о том, слышен ли 
звук падающего дерева в лесу, когда рядом никого нет: если ошибка не приводит 
к неправильным результатам и не вызывает заметного пользователю замедления, 
то стоит ли тратить время на ее исправление? 


Автономное тестирование 


Нет сомнений, что вы пишете тесты для своего кода. Для проверки небольших 
компонентов вы пишете автономные тесты, а чтобы убедиться в правильности 
взаимодействия разных компонентов — интеграционные тесты. Возможно, вы 
даже из тех разработчиков, которые сначала пишут автономные тесты, а только 
потом программу, для которой эти тесты должны проходить. 

Но необходимо каким-то образом организовать все эти тесты, и тут на помощь 
приходит тестовая оснастка. Так называется система, которая подготавливает 
окружение для каждого теста, прогоняет его и сообщает, совпал ли полученный 
результат с ожидаемым. Как и в случае отладчика, я полагаю, что среди читателей 
найдутся как те, кто искренне удивится: разве есть люди, не пользующиеся тесто- 
вой оснасткой? – так и те, кто никогда ни о чем таком не задумывался. 

Выбор велик. Несложно написать макрос-другой, которые будут вызывать тес- 
тируемую функцию и сравнивать возвращенное значение с ожидаемым. И нет 
недостатка в авторах, которые превратили эту простую идею в полноценную тес- 
товую оснастку. Приведу цитату из книги [Раре 2008]: «Во внутреннем репозито- 
рии Майкрософт в категории тестовые оснастки находится более 40 разделяе- 
мых инструментальных средств». Чтобы быть последовательным, я познакомлю 
вас с тестовой оснасткой из библиотеки СТ4Ь, но поскольку все они похожи и по- 
скольку я не собираюсь приводить здесь все руководство по СТА, то рассмотрю 
лишь те аспекты, которым есть очевидные аналоги и в других тестовых оснастках. 

У тестовой оснастки есть несколько особенностей, выгодно отличающих ее от 
написанного на коленке тестового макроса. 

О Необходимо тестировать отказы. Если функция должна аварийно завер- 
шить программу с сообщением об ошибке, то должно быть средство про- 
верить, что программа действительно завершилась в полном соответствии 
с ожиданиями. 

О Все тесты должны быть изолированы, то есть прогон теста З не должен вли- 
ять на результат теста 4. Если вы хотите удостовериться, что две процеду- 
ры взаимодействуют правильно, сначала протестируйте их по отдельности, 
а затем выполните одну за другой в составе интеграционного теста. 
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О Перед прогоном тестов, скорее всего, нужно будет подготовить какие-то 
структуры данных. Подготовка окружения для теста иногда требует доволь- 
но много работы, поэтому хорошо бы иметь возможность прогнать несколь- 
ко тестов, требующих одинаковой настройки. 

В примере 2.3 показано несколько простых автономных тестов для словаря из 
раздела «Реализация словаря» ниже. Они иллюстрируют все триописанныхсвой- 
ства тестовой оснастки. Видно, как последний пункт определяет поток выполне- 
ния: в начале программы определяется новый тип структуры, затем идут функции 
для инициализации и очистки структуры этого типа, а при наличии всего этого 
уже нетрудно написать несколько тестов, работающих в подготовленном окруже- 
нии. 

Словарь – это просто множество пар ключ/значение, поэтому тестирование 
в основном сводится к поиску значения для заданного ключа и проверке правиль- 
ности результата. Отметим, что ключ КИШ недопустим, поэтому мы проверяем, что 
при попытке передать такой ключ программа завершается. 


Пример 2.3 * Тестирование словаря из раздела «Реализация словаря» (дісі їеѕї.с) 


#іпс1џае <91іБ.һ> 
#іпс1іџае "ісе. һ" 


суреаеЕ ѕігисі { 


дісёіопагу *аа; о 
} Айхеоге; 
уоіа 41сЕ зебир (АЙхеиге *АЁ, дсопѕіроіпёег беѕі аба) { ө 


ағ->аа = аіссіопагу пем (); 
аісёіопагу ааа (а#->аа, "Кеу1", "уа11"); 
дісііопагу ааа (а#->аа, "кеу2", М0); 


уоіа дісі ёеагдомип (Айхеиге *АЁ, дсопѕіроіпіег іеѕі аёѓа) { 
дісёіопагу Ёгее (ағ->аа); 
} 


уоіа сһеск Кеуѕ (41сЕ1опагу сопѕі *а) { © 
сһаг *доб і = аісбіопагу Нпа(а, "хх"); 
9_аззеге (доб іі == дісбіопагу поё ҒЁоџпа); 
дої іё = аісёіопагу бпа(а, "Кеу1"); 
9 _аѕѕегі стрѕег (дої іб, ==, "ма11"); 
доб іЕ = аісёіопагу бпа (а, "Кеу2"); 
9_аѕѕегі стрѕіг (доб іє, ==, МОЬЬ); 


уоіа беѕі пем (іхёиге *а#, дсопѕіроіпіёег ідпогеа) { 
сһеск_Кеуѕ (ағ->аа); 
} 


уоіа ЕезЕ_сору (ЯЙхеиге *АЁ, дсопѕіроіпёег ідпогеад) { 
91сЕ1опагу *ср = 91сЕ1опагу_сору (ағ->аа); 
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спеск_Кеуз (ср); 
дісііопагу Ёгее (ср); 


уоіа безе Ғаі1иџге () { ө 


1Е (9 беѕі гар Ғогк(0, Сб ТЕЅТ ТКАР ЅІГЕМСЕ ЅТрО0Т | 
С ТЕЅТ ТКАР ЅІГЕМСЕ ЅТрЕВК)) { 
аісёіопагу *аа = дісбіопагу пем (); 
аісёіопагу ааа (аа, МО, "Б1апк"); 
} 
д беѕё ёгар аѕѕегі Ғаі1еа(); 
д9 безі ігар аѕѕегі ѕідегг ("МО із пої а уа1іа кеу. \п"); 


106 таіп (іп агдс, сһаг **агду) { 


9 беѕё іпіє (&вагдс, вагду, МОШ); 
9 беѕі ааа ("/ѕес1 /пен безі", Айхеиге, МОЦ, (5, 
адісі ѕеёир, беѕі пем, діс беагдомп); 
9 безі ааа ("/ѕес1/сору Еез®", айіхіџге, МОЪЬ, 
аісе ѕеир, беѕі сору, діс беагаомип); 
9 безі ааа Ёипс ("/ѕес2/Ғаі1 беѕё", беѕі Ғаі1џге); ө 
геигп 9 беѕі гип (); 


Элементы, используемые в наборе тестов, называются фикстурой. СТАЛЬ требу- 
ет, чтобы все фикстуры были структурами, поэтому мы создали одноразовую 
структуру, которая передается из функции инициализации в сам тест и затем 
в функцию очистки. 

Это функции инициализации и очистки, в которых соответственно создается и 
уничтожается структура данных, используемая в нескольких тестах. 

Сами тесты – это просто последовательности простых операций над структу- 
рами, определенными в фикстуре, и утверждения относительно ожидаемого 
результата этих операций. Тестовая оснастка из СТА предоставляет ряд мак- 
росов утверждений, например использованный здесь макрос для сравнения 
строк. 

Для тестирования отказа СТЛЬ пользуется определенным в РОЅІХ системным 
вызовом Ёогк (следовательно, в Міпӣомѕ без подсистемы РОЅІХ это работать 
не будет). Вызов Ёогк создает новый процесс, в котором исполняются предло- 
жения, перечисленные в ветви 1+, которые должны привести к вызову абогї. 
Программа наблюдает за порожденным процессом и проверяет, чтоон действи- 
тельно завершился аварийно, записав в зійегг ожидаемое сообщение. 

Тесты собраны в наборы, идентифицируемые строками, похожими на пути. 
В качестве указателя на дополнительные данные (помимо инициализирован- 
ных системой), которые могут использоваться в тесте, в данном случае пере- 
дается МОТ... Обратите внимание, что в функциях їеѕї пем и {ез{ сору исполь- 
зуются одинаковые функции инициализации и очистки. 

Если тест не требует инициализации и (или) очистки, для его прогона можно 
воспользоваться более простой формой. 
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Использование программы в качестве библиотеки 


Единственная разница между библиотечной функцией и программой - это то, что 
в программе имеется функция паіп, являющаяся точкой входа, в которой начина- 
ется выполнение. 

Но бывает так, что файл делает какую-то одну сравнительно несложную вещь 
и не заслуживает оформления в виде отдельной разделяемой библиотеки. Однако 
тесты для него все равно написать нужно, но я могу поместить их в тот же файл, 
окружив директивами условной компиляции. В примере ниже, если символ Тез _ 
орегабіопѕз определен (любым из рассматриваемых ниже способов), код становит- 
ся программой, прогоняющей тесты, а в противном случае (типичном) этот код 
компилируется без па1п и, стало быть, является библиотекой, которую можно ис- 
пользовать в других программах. 


іпе орегабіоп опе () { 


} 


іп орегаёіоп (мо () { 


} 
#1Е4еЕ Теѕі орегаііопѕ 


уоіа орбеѕі () { 


106 таіп (іп агдс, сһаг **агду) { 
д беѕі іпі (вагас, вагду, МОШ); 
д_беѕ айа Ғопс ("/ѕес/а беѕі", сеѕі Ғаі1џге); 
} 
#епаіѓ 


Существует несколько способов определить символ Тез{ орегаїіопѕ. Можно за- 
дать дополнительный флаг в файле таКе#е: 


СРЬАб5=-ОТезЕ орегаііопѕ 


Флаг компилятора -0, определенный в стандарте РОЅІХ, эквивалентен включе- 
нию директивы #еЁпе Теѕі орегаїіопѕ в начало компилируемого с-файла. 

При рассмотрении Ащюогтаке в главе 3 мы познакомимся с оператором +=, ко- 
торый позволяет следующим образом добавить флаг -0 в набор обычных флагов 
в переменной АМ СЕ1АС5: 


спеск_СЕЬАС$ = $ (АМ_СЕЬАС5) 
спеск_СЕЬАС$ += -рТеѕё орегабіопѕ 


Условное включение паіп оказывается полезным и в других случаях. Например, 
мне часто приходится выполнять анализ причудливых наборов данных. Перед 
тем как произвести окончательный анализ, я должен написать функцию, которая 
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будет читать и очищать данные, а затем несколько функций для вывода итого- 
вой статистики, контроля разумности данных и уведомления о ходе работы. Все 
это я помещаю в файл тоае/опе.с. На следующей неделе у меня может возникнуть 
идея о новой дескриптивной модели, в которой, естественно, будут активно ис- 
пользоваться существующие функции очистки данных и отображения итоговой 
статистики. Путем условного включения функции па1л в тоае/опе.с я могу быстро 
превратить программу в библиотеку. Вот заготовка файла тодеопе.с: 


уоій геа@_Чака() { 
[здесь должна быть работа с базой данных] 


} 


#1ЕпаеЕ МОРЕГОМЕ 1ІВ 
іп таіп () { 
геаа даѓа (); 


} 
#епаі ғ 


Я использую #іЁпде# вместо #і еї, потому что тоае/опе.с, как правило, исполь- 
зуется в качестве программы, но в остальном все работает так же, как в случае 
условного включения паіл для тестирования. 


Покрытие 


Каково тестовое покрытие вашего кода? Существуют ли в нем строки, которые 
не выполнялись при прогоне тестов? Вместе с 5сс поставляется программа рсоу, 
которая подсчитывает, сколько раз выполнялась каждая строка во время работы 
программы. Процедура выглядит следующим образом: 

О Добавить в переменную СРІАбЅ для рсс флаги -Ергой]е-агсз -Еез{-соуегаде. 
Стоит также добавить флаг -00, чтобы оптимизатор не исключал строки. 

О Входе работы программы для каждого исходного файла уоитсоае.с порож- 
дается один или два файла: уоитсойе. есаа и уоитсо4е. Еспо. 

О Команда дсоу уоитсоде.всаа выводит в $190 процентную долю исполняе- 
мых строк, которые действительно исполнялись во время прогона програм- 
мы (объявления, директивы #1пс114е и т. п. не считаются), и создает файл 
уоитсойе.с.со0. 

О В первом столбце таблицы в файле уоитсоде.с.сои показано, сколько раз каж- 
дая исполняемая строка исполнялась тестами, а строки, которые не испол- 
нялись ни разу, помечены большим жирным маркером #####. Именно на них 
следует обращать внимание при написании очередного теста. 

В примере 2.4 приведен скрипт оболочки, содержащий все описанные выше 
шаги. Я воспользовался встроенным документом для генерации таКе#е. После 
компиляции, прогона и выполнения дсоу я с помощью дгер ищу маркеры #####. 
Флаг -С3 при вызове СМУ дер означает, что нужно выводить три контекстные 
строки, окружающие те, где найдены совпадения. Этот флаг не описан в стандарте 
РОЗХ, как, впрочем, и ркд-сопйд и флаги для генерации тестового покрытия. 
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Пример 2.4 * Скрипт, который компилирует программу для генерации тестового 
покрытия, прогоняет тесты и ищет строки, еще не покрытые тестами (дсо\.$П) 


сає > такейіе << '------ ! 

Рр=аісі безі 

орјесіѕ= Кеууа1.о аісі.о 

СЕЬАС$ = `ркд-сопіід --сһђадѕ 9115-2.0` -9 -Ма11 -зЕ4=9пи99 \ 
-00 -Ёргой1е-агс$ -#беѕі-соуегаде 

БОГВ$ = `рка-сопід --1ірѕ 911Ь-2.0` 

ССс=дсс 


$ (Р) :5 (орјесёѕ) 


таке 

./аісе беѕі 

Ғог і іп *дсда; ао дсоу $1; Яопе; 
дгер -СЗ '#####' *.с.дсоу 


Встроенная документация 


Документация необходима. Вы это знаете, как знаете и то, что при изменении кода 
нужно поддерживать документацию в актуальном состоянии. И тем не менее за- 
частую документация – первое, что откладывают на потом. Ведь так легко сказать: 
работает же, а документацию напишу позже. 

Поэтому необходимо упростить написание документации по максимуму. А это 
означает, что документация должна быть в том же файле, что сам документируе- 
мый код, как можно ближе к нему, и при этом нам необходимы средства извлечь 
документацию из файла с кодом. 

Размещение документации рядом с кодом означает также, что вы с большей 
вероятностью прочтете ее. Нужно выработать у себя привычку перечитывать до- 
кументацию по функции, перед тем как вносить в нее какие-либо модификации. 
Это не только позволит вспомнить, что происходит внутри функции, но и понять, 
нужно ли будет изменить документацию после изменения кода. 

Я расскажу о двух способах встраивания документации в код: Оохувеп и СМЕВ. 
То и другое легко установить с помощью менеджера пакетов. 


Оохудеп 


Юохувеп – простая система с простыми целями. Она рассчитана на то, что автор 
снабдит описанием каждую функцию, структуру и другие подобные элементы 
программы. Предполагается, что таким образом документируется внешний интер- 
фейс для пользователей, которые никогда не будут заглядывать в сам код. Описа- 
ние размещается в блоке комментария непосредственно над функцией, структу- 
рой и т. п., так чтобы было естественно сначала написать документацию, а потом 
саму функцию - не нарушая данных по поводу ее работы обещаний. 

Синтаксис Похудеп несложен, приведенных ниже правил достаточно, чтобы 
начать им пользоваться. 
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О Если блок комментария начинается косой чертой с двумя звездочками - /** 
вот так */, то Оохудеп его разбирает. Комментарии вида /* вот так */ игно- 
рируются. 

О Если вы хотите, чтобы Рохудеп обработал файл, то нужно поставить ком- 
ментарий /** \е */ в начале файла; см. пример. Если вы забудете это сде- 
лать, то Оохувеп ничего не сгенерирует для этого файла и не предупредит 
о возможной ошибке. 

О Размещайте комментарий непосредственно перед функцией, структурой и 
Т. д. 

О Описания функций могут (и должны) включать блоки \рагап, в которых 
описываются входные параметры, и блок \геѓигп с описанием возвращаемо- 
го значения. См. пример ниже. 

Используйте блок \геѓ для перекрестных ссылок на другие документиро- 
ванные элементы (в том числе функции или страницы). 

Вместо обратной косой черты можно использовать знак ё, например: @#1е, @ 
паіпраде и т. д. Этот синтаксис имитирует систему Јауарос, которая, в свою 
очередь, похоже, имитирует \/ЕВ. Будучи пользователем ГаТеХ, я предпо- 
читаю обратную косую черту. 

Для запуска Похубеп необходим конфигурационный файл, а настраиваемых 

параметров более чем достаточно. В Рохувеп применяется ловкий трюк, чтобы 
облегчить работу; выполните команду 


аохудеп -9 


и конфигурационный файл будет сгенерирован автоматически. Потом можете 
его открыть и отредактировать; разумеется, он прекрасно документирован. Пос- 
ле этого запускайте саму программу дохудеп, чтобы сгенерировать документацию 
в формате НТМІ, РОЕ ХМІ или страниц руководства - как указано в конфигу- 
рационном файле. 

Если на машине установлен пакет СгарЬу12 (менеджер пакетов вам в помощь), 
то Оохувеп может сгенерировать графы вызовов: диаграммы со стрелками, пока- 
зывающими, как одни функции вызывают другие. Если вас попросят быстро разо- 
браться в запутанной программе, то это неплохой способ понять, как она устроена. 

Я спомощью Рохуреп документировал программу, описанную в разделе «ШЬхті 
и СОВГ» ниже; посмотрите, как выглядит снабженный комментариями код, или 
запустите Оохурбеп и ознакомьтесь с порожденной документацией. 

Все встречающиеся в этой книге фрагменты, начинающиеся с /**, записаны 
в формате Оохурдеп. 


Повествование 


Документация должна состоять по меньшей мере из двух частей: техническая, 
в которой приведена детальная информация обо всех функциях, и повествова- 
тельная, в которой объясняется, для чего предназначен пакет и как в нем сориен- 
тироваться. 
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Повествовательную часть начинайте в блоке комментария с заголовком 
\па1праде. Если генерируется документация в формате НТМІ, то эта часть станет 
файлом іпдех. ті сайта – первой страницей, которую увидит посетитель. На ней 
могут быть размещены ссылки на другие страницы, каждая из которых должна 
иметь заголовок вида: 

/** \раде опеиогаёад Заголовок вашей страницы 
к 

Наглавной странице (или налюбой другой, в том численастранице документа- 
ции по функции) поместите блок \геѓ опеногіѓад, который преобразуется в ссылку 
на страницу. Если есть необходимость, можно пометить и озаглавить также глав- 
ную страницу. 

Повествовательные страницы могут находиться в любом месте кода. Иногда 
имеет смысл приблизить текст к коду, а иногда вынести в отдельный файл, состоя- 
щий исключительно из блоков комментариев для Оохуреп; назвать его можно, на- 
пример, фоситетаноп.й. 


Грамотное программирование с помощью СМЕВ 


Систему форматирования документов ТеХ часто приводят в качестве эталона 
сложной системы, спроектированной так, как надо. Ей уже исполнилось 35 лет, 
но до сих пор она (по мнению автора) порождает самые красиво отформатирован- 
ные математические тексты для любой существующей наборной системы. Многие 
системы, разработанные позднее, даже не пытаются конкурировать с ТЕХ, а ис- 
пользуют ее в качестве основы для типографского набора. Автор, Дональд Кнут, 
предлагал вознаграждение за найденные ошибки, но в конце концов снял свое 
предложение, поскольку за вознаграждением за много лет так никто и не обра- 
тился. 

Д-р Кнут объясняет высочайшее качество ТеХ тем, как она написана. Он упо- 
требляет термин грамотное программирование (1іќегаќе ргоргаттіпе), понимая 
под этим тот факт, что каждому процедурному блоку предшествует объяснение 
(напонятном английском языке) его назначения и функционирования. Конечный 
продукт выглядит как неформальное описание кода, в которое тут и там вкрап- 
лен сам код, необходимый, чтобы формализовать это описание для компьютера 
(в противоположность типичной документированной программе, в которой кода 
гораздо больше, чем объяснений). Кнут писал ТеХ, пользуясь системой \!ЕВ, 
которая вплетает в пояснительный англоязычный текст код на языке РАЅСАІ. 
В наши дни код будет написан на С, и теперь, когда к созданию красивой доку- 
ментации привлечен ТеХ, мы вполне можем использовать его в качестве языка 
разметки пояснительной части. Итак, познакомимся с СМЕВ. 

Что касается вывода результатов, то легко найти учебники, разъясняющис, как 
использовать СМЕВ для организации и даже презентации содержимого (напри- 
мер, [Напзоп 1996]). Если кто-то другой захочет изучить ваш код (скажем, коллега 
или член группы критического анализа), то СМЕВ сможет оказать реальную по- 
МОЩЬ. 
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Программу в разделе «Пример: основанная на агентах модель формирования 
группы» (стр. 281) я написал с использованием С\/ЕВ; ниже приведена краткая 
сводка того, что нужно знать для ее компиляции и понимания специфичных для 
СМЕВ особенностей. 

О Файлы СҰЕВ принято сохранять с расширением о. 

О Для создания ѓех-файла выполните команду снеахе дгойрз .м; затем для соз- 

дания РОЕ-файла – команду раЁех дгоџрѕ.їех. 

О Для создания с-файла выполните команду сёапд1е дгоирз.м. СМО таке знает 
о расширении ., поэтому паке дгопрз запустит с*апд1е автоматически. 

Программа сёапдіе удаляет комментарии, а это значит, что СМЕВ и Оохурдеп 
несовместимы. Быть может, имеет смысл создать файл, в котором описаны все от- 
крытые функции и структуры, и обрабатывать его программой 4охувдеп, оставив 
СУ\УТЕВ для основного набора файлов с кодом. 

Ниже приведено руководство по С\/ ЕВ, сведенное к нескольким пунктам. 

О Все специальные коды СМЕВ представляют собой знак @, за которым сле- 

дует один символ. Правильно писать @<{1{1е5@>, а не @<іпсоггесї (101е5>#. 

О В каждом сегменте имеется комментарий, за ним код. Комментарий может 
быть пустым, но структура комментарий-код должна выдерживаться, ина- 
че возможны самые разные ошибки. 

Текстовая секция начинается знаком # с последующим пробелом. Затем по- 
яснепия в формате ТЕХ. 

Безымянный блок кода должен начинаться с @с. 

Именованный блок кода начинается с заголовка, после которого должен 
находиться знак равенства (потому что это определение): @<ап орегаѓіопё>=. 
Этот блок копируется буквально всюду, где встречается соответствующий 
заголовок. Иначе говоря, имя блока - это, по существу, макрос, расширяе- 
мый заданным вами кодом, но без дополнительных возможностей макросов 
препроцессора С. 

О Секции (в примере есть секции, относящиеся к членству в группах, ини- 
циализации, построению графиков с помощью Спиріоѓ и т. д) начинаются 
управляющей последовательностью @*, за которой следует заголовок, завер- 
шающийся точкой. 

Этого достаточно, чтобы начать самостоятельно работать с СМЕВ. Изучите вы- 

шеупомянутый пример на стр. 281 — все ли там понятно? 


о оо о 


Как стать классной машинисткой 


При отборе многих тем для этой книги я руководствовался собственным опытом кон- 
сультирования коллег в части программирования на С и по ходу дела выяснял, что вы- 
зывает у них трудности. Для одних камнем преткновения была настройка окружения, 
другим никак не давались указатели, и, как ни странно, немало было и таких, кто не 
мог поладить с клавиатурой. Конечно, прямого отношения к программированию это не 
имеет, но люди, неуверенно печатающие на клавиатуре, не склонны использовать язык, 
в котором такой вот изобилующий знаками препинания текст Ёог (1=0; 1<10; 1++) — обыч- 
ное дело. 

И вот какой совет я даю тем, кто испытывает такого рода трудности: возьмите тонкую 
футболку и набросьте ее на клавиатуру. Засуньте руки под футболку и начинайте печатать. 
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Идея в том, чтобы нельзя было украдкой взглянуть на клавиатуру и найти нужную кла- 
вишу. Вам, конечно, известно, что клавиши бегать не умеют и всегда находятся там, где 
вы их оставили. Однако те краткие паузы, которые мы делаем, чтобы убедиться в этом, 
снижают скорость печати. 

Если печать вслепую поначалу вызывает горькое разочарование, постарайтесь преодо- 
леть его и привыкнуть к тем редко используемым клавишам, которые раньше не удосу- 
жились выучить. Обретя уверенность в обращении с клавиатурой, вы сможете уделить 
больше умственной энергии написанию программ. 


Проверка ошибок 


Любой уважающий себя учебник программирования обязан включать хотя бы 
одну лекцию на тему о том, как важно обрабатывать ошибки, возвращенные вы- 
зываемыми функциями. 

Ну что ж, считайте, что лекцию вы прослушали. И обратимся к другой стороне 
проблемы: как и когда возвращать ошибки из своей функции. Существует великое 
множество типов ошибок, встречающихся в самых разных контекстах, поэтому 
рассмотрим несколько более частных вопросов. 

О Что пользователь будет делать с сообщением об ошибке? 

О Предназначена ошибка пользователю или другой функции? 

О Как уведомить пользователя об ошибке? 

Третий вопрос я отложу на потом (раздел «Возврат нескольких значений из 
функции» на стр. 225), но и первые два дадут нам достаточно пищи для размыш- 
лений. 


Ошибки и пользователи 


Бездумный подход к обработке ошибок, при котором код пестрит проверками — 
ведь много не бывает, да? – вовсе не обязательно является правильным. Строки, 
где обрабатываются ошибки, необходимо сопровождать, как и все остальные, а лю- 
бой пользователь вашей функции вынес из лекций твердый урок – обрабатывай 
все возможные коды ошибок. Поэтому если вы возвращаете код ошибки, который 
невозможно разумно обработать, то у пользователя функции останется чувство 
вины и неуверенности в себе. Существуеттакая вещь, как избыток информации. 
Чтобы подступиться к вопросу о том, как будет использована информация об 
ошибке, рассмотрим смежный вопрос: как вообще пользователь может столкнуть- 
ся сошибкой. 
О Иногда пользователь не может узнать, допустим ли входной параметр, не 
вызвав функцию. Классический пример – поиск ключа в множестве ключей 
и значений, в результате которого обнаруживается, что ключа там нст. В та- 
ком случае можно считать, что это функция поиска, возвращающая ошибку, 
если ключ отсутствует в множестве. А можно подойти по-другому и счи- 
тать, что у функции две задачи: искать ключ и сообщать пользователю, есть 
ключ или нет. 
Или возьмем пример из школьного курса алгебры: для того чтобы найти 
корни квадратного уравнения, необходимо вычислить квадратный корень 
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зак (Б*р - 4*а*с); если выражение в скобках отрицательно, то вещественных 
решений у уравнения нет. Смешно ожидать, что пользователь будет вычис- 
лять, чему равно Б*Ь - 4*а*с, чтобы понять, можно обращаться к функции 
или нет; разумнее сделать так, чтобы функция для решения квадратного 
уравнения либо возвращала его корни, либо сообщала, что вещественных 
корней нет. 

В этих примерах проверка входных параметров нетривиальна, а «плохие» 
параметры - это даже не ошибка, а результат естественного использования 
функции. Если функция обработки ошибок аварийно завершает программу 
или делает еще что-то столь же деструктивное (как показанный ниже об- 
работчик), то вызывать ее в подобных случаях не следует. 

Пользователь передает откровенно неправильные параметры, например 
нулевой указатель или еще какие-то некорректные данные. Ваша функция 
должна отлавливать такие вещи, чтобы предотвратить нарушение защиты 
памяти или что-то в этом роде, но трудно представить, что вызывающая про- 
грамма могла бы сделать с информацией о таких ошибках. В документации 
по функции уопгЁп ясно сказано, что указатель не должен быть равен МОМ, и 
если пользователь игнорирует это и пишет іпі* 1пдаба=МОБЬ; уоцеЕп (1пдафа), 
а в ответ получает ошибку вида Еггог: МІ роіпёег іприќ, то непонятно, что 
именно пользователь должен сделать по-другому. 

В начале функции обычно имеется несколько строк вида 1# (1приё1==МЪЬ) 
геіигп -1; ... 1Е (1прої20==МОШ) гебигп -1;, и мой опыт показывает, что пере- 
числять в документации, какое именно из базовых требований нарушено — 
значит впадать в грех избыточной информации. 

Ошибка возникла по внутренним причинам. Сюда относятся и ошибки типа 
«такого не должно быть», когда в результате внутреннего вычисления полу- 
чается невозможный ответ - то, что в американском психоделическом рок- 
мюзикле «Волосы» называется «повреждениями плоти». Примерами могут 
служить отсутствие ответа от оборудования, пропадание сети или подклю- 
чения к базе данных. 

Повреждения плоти обычно можно устранить (например, пошевелить сете- 
вой кабель). Или если пользователь просит разместить в памяти гигабайт 
данных, а столько места нет, то вполне разумно будет сообщить об ошибке 
нехватки памяти. Однако если не получается выделить память для строки 
из 20 символов, то либо машина перегружена и скоро ее работа станет не- 
стабильной, либо вообще случился пожар - в таком случае вызывающая 
программа вряд ли сможет сделать что-то осмысленное для восстановле- 
ния. В зависимости от контекста сообщения об ошибках типа «пожар, спа- 
сайся кто может» бывают контрпродуктивными и могут расцениваться как 
избыток информации. 

Внутренние ошибки (то есть не связанные с внешними условиями и не- 
корректными входными параметрами) вызывающая программа обработать 
не может. В таком случае детальная информация, по-видимому, является 
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избыточной для пользователя. Вызывающая сторона должна знать, что 
результат работы функции ненадежен, но наличие многочисленных кодов 
ошибок только усложняет работу пользователя (который все эти ошибки 
обязан обрабатывать). 


Учет контекста, в котором работает пользователь 


Как было сказано выше, мы нередко проверяем в функции правильность вход- 
ных данных. Неправильные параметры - это, строго говоря, не ошибка, и функция 
должна бы в этих случаях возвращать осмысленное значение, а не вызывать обра- 
ботчик ошибок. Далее в этом разделе мы будем рассматривать только настоящие 
ошибки. 

О Если пользователь программы имеет доступ к отладчику и работает в кон- 
тексте, где его использование практически возможно, то самый простой 
способ уведомить об ошибке – вызвать функцию арогі, которая аварийно 
завершает программу. После этого пользователь может ознакомиться с ло- 
кальными переменными и обратной трассировкой прямо на месте преступ- 
ления. Функция арогї входила в стандарт С с самого начала (она объявлена 
в заголовке <54110.ћ>). 

О Если пользователем функции является, например, Јауа-программа или че- 
ловек, понятия не имеющий, что такое отладчик, то вызов арогї — прямое 
кощунство, а правильно было бы вернуть код ошибки, описывающий, что 
произошло. 

Оба случая встречаются на практике, поэтому было бы разумно предоставить 

пользователю возможность выбрать подходящий режим работы. 

Давненько уже не встречались мне нетривиальные библиотеки, в которых не 
было бы собственной реализации макроса для обработки ошибок. На этом уровне 
стандарт С ничего не предлагает, но написать такой макрос с помощью стандарт- 
ных средств нетрудно, чем все и пользуются. 

Стандартный макрос аѕѕегі (совет: #1пс1и4е <аѕѕегі.һ>) проверяет переданное 
ему утверждение и останавливает программу, если оно оказывается ложным. Кон- 
кретные реализации могут быть различны, но идея такова: 


#аеѓіпе аззег® (ёеѕї) (+е5е) ? 0 : арогі(); 


Сам по себе макрос аѕѕегї полезен, когда нужно проверить правильность выпол- 
нения промежуточных шагов внутри функции. Я также люблю применять аѕѕегї 
вкачестве документации: конечно, это условие, которое должен проверить компыо- 
тер, но когда человек видит строку аѕѕегї (па{г1х_а->512е1 == таігіх р->512е2), он 
понимает, что размерности двух матриц должны быть определенным образом свя- 
заны. Однако аѕѕегі предполагает только одну реакцию (аварийное завершение), 
поэтому утверждения необходимо обертывать как-то иначе. 

В примере 2.5 приведен макрос, удовлетворяющий обоим условиям, в разделе 
«Макросы с переменным числом аргументов» я рассмотрю его более подробно. 
Отмечу, что некоторые пользователи функций работают с $(4егг без затруднений, 
тогда каку других вообще нет средств для работы с этим потоком. 
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Пример 2.5 * Макрос для обработки ошибок: сообщить или вывести в журнал 
и предоставить пользователю возможность решить, нужно ли останавливать 
программу или можно продолжить выполнение (ѕѓоріѓ.ћһ) 

#іпс1џае <ѕіаіо.һ> 

#іпс1џде <56а11іЫ.һ> //аБоге 


/** Присвоить этой переменной значение \с '5', если нужно, чтобы программа 
останавливалась после ошибки. 
В противном случае программа будет возвращать код ошибки. * / 

сһаг еггог моде; 


/** Куда писать сообщения об ошибках? Если \с МОШ., писать в \с ѕёдйегг. */ 
РТЬЕ *еггог 109; 


#аеѓіпе Зкор1# (аѕѕегсіоп, еггог асбіоп, ...) {\ 
іЁ (азѕегбіоп) { \ 
ЁргіпеЁ (еггог 109 ? еггог 109 : зідегг, _ УА АКб5 ); \ 
Ерг1пЕ Е (еггог 109 ? еггог 109 : зійегг, "\п"); \ 
1Е (еггог пойе=='5') аБогЕ(); \ 
е1зе {еггог асёіоп;} \ 


} } 


Вот несколько примеров использования этого макроса: 


Ѕеорії# (!іпуа1, гебогп -1, "іпуа1 тиѕі поё Бе МО"); 
ЅЕоріғ (іѕпап (са1сей уа1), доо папуа1, "Са1сей уа1 маѕ МаМ. С1еапіпд 
ор, 1Іеауіпд."); 


папуа] : 
Ғгее (ѕсгаёсћһ ѕрасе); 
гебигп МАМ; 


Самый распространенный способ обработки ошибки – просто вернуть некое 
значение, поэтому если вы применяете данный макрос в представленном виде, то 
будьте готовы часто набирать ге игп. Впрочем, это, может, и неплохо. Авторы про- 
грамм часто сетуют на то, что хитроумные конструкции &гу-саёсВ – по существу, 
не более чем модернизированный вариант всеми осуждаемого доѓо. Например, во 
внутреннем руководстве Соое по стилю кодирования рекомендуется избегать 
блоков ѓгу-саѓсћ, и в обоснование приводится именно это сходство с доќо. Утверж- 
дается, что лучше явно дать понять читателю, что поток выполнения программы 
будет перенаправлен на выдачу ошибки (и куда именно), а методика обработки 
ошибки должен быть как можно проще. 


Как следует возвращать уведомление об ошибке? 


К этому вопросу я еще вернусь в главе о работе со структурами (точнее, в разделе 
«Возврат нескольких значений из функции»), потому что если уровень сложности 
функции превышает некий порог, то возврат структуры — вещь очень полезная, 
а тогда уже нетрудно и разумно добавить в структуру переменную, описывающую 
ошибку. Например, в предположении, что функция возвращает структуру оч, 
в которой есть поле еггог типа сһаг*, мы можем написать: 
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ЗЕ0ор1#(!1пуа1, ооё .еггог="іпуаї мизе по Бе МОБ"; гебигп оц 
"іпуа1 мизё поб Бе МО"); 


В библиотеке СТЛЬ имеется система обработки ошибок на основе специального 
типа бЕггог, указатель на который нужно передавать в качестве аргумента любой 
функции. Предлагается также несколько дополнительных средств, помимо пред- 
ставленного в примере 2.5 макроса, в том числе области ошибок и упрощенный 
метод передачи ошибок от дочерних функций родительским, – но все это ценой 
увеличения сложности. 
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Создание пакета 
лля проекта 


Раз вы дочитали до этого места, то уже знакомы с инструментами для решения 
важпейших проблем, возникающих при программировании на С, в частности от- 
ладки и документирования кода. Если вам не терпится поскорее заняться самим 
языком, то можете сразу перейти к части П. А в этой и в следующей главах будут 
рассмотрены инструменты для тяжелых работ – совместной разработки и рас- 
пространения программ, а именно средства сборки пакетов и система управления 
версиями. Попутно мы будем говорить о том, как эти инструменты помогают про- 
граммировать соло. 

Я уже упоминал об этом во введении, но, поскольку введения никто не читает, 
повторю: сообщество, сложившееся вокруг С, привержено высочайшим стандар- 
там интероперабельности. Да, оглядевшись вокруг в своем офисе или в кафетерии, 
вы обнаружите, что все пользуются примерно одними и теми же инструментами, 
но, выйдя за пределы узкого мирка, вы столкнетесь с поразительным разнообрази- 
ем. Лично я довольно часто получаю письма от людей, которые пользуются напи- 
санным мной кодом в системах, которых я никогда не видывал; мне это кажется 
удивительным, и я бываю очень доволен, что не шел по легкому пути – написать 
код, который будет работать только на моей платформе, – а стремился к интеро- 
перабельности. 

В наши дни основной технологией распространения кода является Аиѓоѓоо!ѕ — 
система автоматической генерации файла таке е, идеально подходящего данной 
системе. Мы уже встречались с ней в разделе «Сборка библиотек из исходного 
кода» выше, когда с ее помощью смогли быстро установить библиотеку СМО 
Заепайс ІлЬгагу. Возможно, сами вы никогда вплотную не работали с Аибобоо(5, 
но именно так люди, сопровождающие систему управления пакетами, создают па- 
кеты для вашей конкретной системы. 

Разобраться в том, что делает АиќоѓооЇѕ, затруднительно, не понимая, как рабо- 
тает таке е, поэтому для начала мы рассмотрим этот вопрос подробнее. В первом 
приближении файл таке е – это организованный набор команд оболочки, а зна- 
чит, необходимо знать, какие средства автоматизации работы предоставляет обо- 
лочка. Путь нам предстоит долгий, но, пройдя его до конца, вы сможете: 

О использовать оболочку для автоматизации работы; 
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применять файлы таке е для организации последовательностей задач, вы- 
полняемых оболочкой. 

использовать Аиѓоќоо]ѕ, чтобы предоставить пользователям возможность 
автоматически генерировать файлы такеЁе в любой системе. 


Оболочка 


РОЗ[Х-совместимая оболочка должна обладать следующими свойствами: 

О развитые макросредства, позволяющие заменить один текст другим, то есть 

предоставлять синтаксис расширения; 

Тьюринг-полный язык программирования; 

интерактивный интерфейс – командная строка — включающий множество 
удобных приемов работы; 

система запоминания и повторного использования ранее набранных ко- 
манд: история; 

много других вещей, о которых я не буду здесь упоминать, в том числе 
управление заданиями и многочисленные встроенные утилиты. 

Синтаксис оболочки очень богат, и в этом разделе мы сможем сорвать только 
немногие низко висящие плоды, иллюстрирующие вышеперечисленные пункты. 
Существует много оболочек (и ниже встретится врезка с предложением попро- 
бовать оболочки, отличные от подразумеваемой по умолчанию), но, если явно не 
оговорено противное, в этом разделе мы будем придерживаться стандарта РОЅІХ. 

Не буду тратить много времени на средства обеспечения интерактивности, но 
все же не могу не упомянуть одно, хотя оно и не включено в РОЅІХ: завершение 
по нажатию клавиши ТаБ. В оболочке Баѕћ, если вы введете начало имени файла 
и нажмете ТаБ, имя будет автоматически продолжено до конца, если существует 
только один вариант завершения; если же вариантов несколько, то повторное на- 
жатие ТаБ позволит увидеть их список. Если вы хотите узнать, сколько команд 
можно ввести в командной строке, дважды нажмите ТаБ в пустой строке, и Баѕћ 
выведет весь список. Другие оболочки идут гораздо дальше Баѕћ: наберите паке 
<бар> в оболочке 2531, и она найдет все цели в файле такеШе. Оболочка Емеп у 
цегасцуе зВе|] (бѕһ) ищет рефераты в страницах руководства, поэтому при вво- 
де пап 1<ёар> она выведет однострочные рефераты для всех команд, начинающих- 
ся буквой 1; иногда это позволяет обойтись без открытия самой страницы руко- 
водства. 

Пользователей оболочек можно отнести к двум группам: те, кто вообще не знает 
об автоматическом завершении и прочих трюках, связанных с клавишей ТаБ, и те, 
кто пользуется ими постоянно при вводе каждой команды. Если раньше вы при- 
надлежали к первой группе, то переход во вторую вам определенно понравится. 


о..0..-9о 


Замена команд оболочки их выводом 


Оболочка во многом ведет себя как макроязык, который позволяет заменять одни 
фрагменты текста другими. В оболочке такие подстановки называются расшире- 
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ниями, и их довольно много разных; в этом разделе мы рассмотрим подстанов- 
ки переменных, подстановки команд, элементы подстановок в историю, а также 
приведем примеры расширения тильды и арифметических подстановок для при- 
митивного калькулятора. Оставляю вам удовольствие прочитать в руководстве 
о расширении псевдонимов, расширении скобок, расширении параметров, разбие- 
нии на слова, расширении путей и расширении по маске. 

Подстановка переменной - это простое расширение. Если переменной следую- 
щим образом присвоено значение 


опеёћіпд="апоёћег ёһіпд" 


в командной строке, то впоследствии можно написать: 


есһо $опеһћіпд 


и на экране будет напечатана строка апоїћег В1пд. 

Оболочка требует, чтобы ни по одну сторону от знака = не было пробелов, со 
временем это начинает раздражать. 

Когда одна программа запускает другую (в РОЅІХ С это делается с помощью 
системного вызова ѓогк ()), дочерней программе передаются копии всех перемен- 
ных окружения. Разумеется, точно так же работает и оболочка: когда вы вводите 
команду, оболочка запускает новый процесс и передает ему все переменные окру- 
жения. 

Однако переменные окружения - это только подмножество всех переменных 
оболочки. Показанное выше присваивание устанавливает переменную оболочки. 
Если же написать 


ехрогЕ опеёћіпд="апоёһег ёһіпд" 


то эта переменная еще и становится доступной для экспорта. Значения экспорти- 
руемых переменных по-прежнему можно изменять в оболочке. 

Следующее расширение, которое мы рассмотрим, связано со знаком обратного 
апострофа `, который не следует путать с прямой одиночной кавычкой '. 


("ў Прямая одиночная кавычка (", в отличие от обратного апострофа) означает, что расшире- 
\_/ ние производить не нужно. Последовательность команд 


г 


опеёћіпд="апоёћег ёһіпд" 
есһо "$опесһіпд" 
есһо 'ѕ$опеёһћіпд' 


напечатает: 


апоёћег ёһіпд 
$опеёћіпд 


Обратные апострофы заменяют заключенную в них команду ее выводом. 

В примере 3.1 показан скрипт, который подсчитывает, сколько строк в програм- 
ме на С содержат один из символов ;, ) или }. Конечно, для большинства целей 
количество строк исходного кода в любом случае не годится в качестве метрики, 
но тем не менее этот инструмент все же не хуже любого другого, да к тому же за- 
нимает всего одну строку кода на языке оболочки. 
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Пример 3.1 * Подсчет строк с помощью переменных оболочки и утилит, 
описанных в РОЅІХ (Ііпесоигпії.ѕћ) 


# Подсчитаем число строк, содержащих ;, ) или }, назовем этот счетчик Ііпеѕ. 
Ііпеѕ= `дгер '[;)})' *.с | мс -1` 


# Теперь подсчитаем, сколько строк в списке каталогов; назовем счетчик 
# РіЈеѕ. 
БіІеѕ=`15 *.с [мс -1` 


есһо #1еѕ=$Еі1еѕ апа 1іпеѕ=$1іпеѕ 


# Арифметическое расширение обозначается двойными круглыми скобками. 
# В Разр остаток отбрасывается, подробнее об этом позже. 
есһо 11пез/#1е = $ (($1іпеѕ/$Рі1еѕ)) 


# Эти переменные можно использовать и во встроенном документе-скрипте. 
# Если установить ѕса1е=3, то результаты будут печататься с 3 знаками 
# после десятичной точки. 

# (Можно также воспользоваться командой Бс -1 (буква эль), которая 

# устанавливает $са1е=20) 

рс << --- 

зса1е=3 

$Ъ1пез/$Е11е5 


Для запуска этого скрипта нужно выполнить команду . 1іпесоџпї.ѕћ. Точка 
в РОЗ[Х-совместимой оболочке означает загрузку исходного кода скрипта. Ско- 
рее всего, ваша оболочка позволяет сделать то же самое с помощью нестандартной, 
но куда более понятной записи зопгсе ]іпесоџпё. $ћ. 


струкции $ (). Например, есћо `аѓе` – то же самое, что есћо $ (да{е). Однако в паке кон- 
струкция $ () употребляется для других целей, поэтому внутри таке#е следует пользо- 
ваться обратными апострофами. 


( № В командной строке пара обратных апострофов в большинстве случаев эквивалентна кон- 
РА 
У 


Применение циклов їог в оболочке для обработки набора 
файлов 


Перейдем собственно к программированию - с предложениями 14 и циклами Ёог. 

Но сначала отмечу некоторые подводные камни и неприятные сюрпризы при 

написании скриптов оболочки. 

О Областей видимости, по существу, нет – практически все глобально. 

О Оболочка - это макроязык, поэтому все нюансы взаимодействия с текстом, 
о которых вас предупреждали при работе с препроцессором С (см. раздел 
«Выращивание устойчивых и плодоносящих макросов» на стр. 172), во 
многом относятся и к скриптам оболочки. 

О Не существует отладчика, умеющего выполнять скрипт в пошаговом режи- 
ме, как описано в разделе «Работа с отладчиком» выше, хотя современные 
оболочки предоставляют средства для трассировки ошибки и выполнения 
скриптов с выдачей подробной информации. 
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О Придется привыкнуть к мелким пакостям, которые поджидают на каж- 
дом шагу; например, нельзя отделять пробелами знак = в присваивании 
опеёћіпд=апоќћег, зато обязательно окружать пробелами скобки [ и ] в пред- 
ложении ії [ -е {Е ] (поскольку на самом деле это ключевые слова, только 
небуквенные). 

Некоторых эти детали не раздражают, и лично я ж оболочку. Я пишу скрипты 
оболочки, чтобы автоматизировать выполнение команд из командной строки, и 
как только код начинает чрезмерно усложняться, скажем, появляются вложен- 
ные функции, я перехожу на Регі, Руёћоп, а\К – в общем, на более подходящий 
язык. 

Для меня прелесть языка программирования, позволяющего писать код прямо 
в командной строке, становится особенно очевидной из-за возможности приме- 
нять одну команду к нескольким файлам. Давайте сделаем резервные копии всех 
с-файлов по старинке — скопировав каждый файл в новый с расширением „Кир: 
Еог Не іп *.с; 
ао 


ср $Н1е $(81е}.Бкир; 
аопе 


Обратите внимание на точку с запятой: она должна находиться после списка 
файлов в той же строке, что ключевое слово ог. Я специально подчеркиваю эту 
деталь, потому что при записи цикла в одной строке: 


Ғог ће іп *.с; 4о ср $Н1е ${#1е}.БЬкир; Яопе 


я неизменно забываю, что нужно писать ; до, а не йо ;. 

Цикл Еог полезен, когда нужно запустить некую программу \ раз. Например, 
скрипт репЁогаӣ. 5ћ ищет в коде на С числа, начинающиеся с определенной цифры 
(то есть нас интересуют цифры в начале строки или после символа, отличного от 
цифры), и выводит найденные строки в файл. 


Пример 3.2 %* Для каждой цифры і ищем в тексте последовательность (не цифра)! 
и подсчитываем такие строки (бепѓога.ѕћ) 

Ғогііпо12345678 9; фо дгер -Е ' (^1[^0-9.]) "$1 \ 

*.с > 1іпеѕ міёћ $(1}; опе 

мс -1 1іпеѕ міёћя // грубая гистограмма распределения цифр 


Проверку закона Бенфорда оставляю в качестве упражнения для читателя. 

Фигурные скобки в ${1} отделяют имя переменной от окружающего текста; 
в данном случае они необязательны, но понадобились бы, если бы нужно было 
записать имя файла вида $ {1} 1іпеѕ. 

Возможно, на вашей машине имеются команды ѕед – они определены в стан- 
дарте ВЗО/СМО, но не в РОЅІХ. Тогда для генерации последовательности можно 
было бы воспользоваться обратными апострофами: 


Ғог 1 іп `ѕед 0 9`; до дгер -Е ' (^| [^0-9.]) "$1 *.с > 1іпеѕ мієћ $(1}; аопе 


Запустить программу тысячу раз? Ничего не может быть проще: 
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Рог і іп `зеа 1 1000`; до ./гип_ргодгам > ${1).оџб; аопе 


#или дописывать все в конец одного файла: 
Ғог і іп `зеа 1 1000`; 4 
есһо оцЕриуЕ Ёог гип $1: >> гип оџериѓёѕ 
./гип_ргодгам >> гип оџёриёѕ 
опе 


Проверка наличия файла 


Допустим, ваша программа должна читать данные из текстового файла и записы- 
вать в базу данных. Мы хотим читать данные только один раз или в виде псевдо- 
кода: іЁ (база данных существует) ‘ћеп (ничего не делать) ее (создать базу данных 
на основе текстового файла). 

В командной строке мы могли бы реализовать эту идею с помощью многоцеле- 
вой команды еѕі, которая обычно встроена в оболочку. Давайте попробуем: вы- 
полните команду 15, чтобы узнать имя какого-нибудь заведомо существующего 
файла, а затем с помощью *ез{ проверьте, что этот файл действительно существует: 
Сеѕі -е а_Н1е_1 Кпом 
есһо $? 


Сама по себе команда {е5* ничего не выводит, но, будучи программистом на С, 
вы знаете, что в любой программе есть функция паіп, которая возвращает целое 
число, его-то мы здесь и используем. По соглашению возвращаемое значение ин- 
терпретируется как порядковый номер проблемы, то есть 0 означает, что никаких 
проблем нет, а 1 в данном случае – что файл не существует (именно поэтому па1п 
по умолчанию возвращает 0, о чем мы будем говорить в разделе «Ни кчему явно 
возвращать значение из таіп» на стр. 154). Оболочка не печатает возвращенное 
значение на экране, а сохраняет его в переменной $2, которую можно распечатать 
командой есћо. 

У самой команды есһо тоже есть возвращаемое значение, и после выполнения 
есћо $? оно будет присвоено переменной $?. Если вы хотите несколько раз исполь- 
зовать значение $2, полученное после выполнения какой-то команды, то сохрани- 
теего в другой переменной: ге игпуа1=5$?. 

А мы проверим это значение в предложении 1Ё и будем что-то делать, только 
если файл не существует. Как и в С, знак ! означает не. 


Пример 3.3 < Проверка, погруженная в предложение И/ЛПеп, – выполните 
эту команду несколько раз (. ійеѕї.ѕһ; . іНеѕї.ѕһ; . ќеѕї.ѕһ) и понаблюдайте, 
как файл то появляется, то исчезает (іЌеѕї.ѕћ) 


ІЁ беѕі ! -е а беѕё ћ1е; ЕПеп 
есһо беѕі Й1е һаа поб ех15%еа 
Соџсћ а безі Й1е 

е15е 
есһо беѕі йе ехіѕіеа 
гп а беѕе #1е 

В 
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Обратите внимание, что, как и в цикле ог, точка с запятой находится не там, 
где казалось бы естественным (мне, по крайней мере). Еще не забудьте про заме- 
чательное правило: любой блок 1{ должен заканчиваться словом іі. Кстати говоря, 
синтаксис е1зе ії недопустим, нужно писать е11{. 

Чтобы было проще запускать этот скрипт многократно, запихнем его в одну 
строку, для которой, правда, не хватает ширины страницы. Ключевые слова [ и ] 
эквивалентны слову їеѕі, поэтому, встретив такую конструкцию в чужом скрипте 
и желая узнать, что имелось в виду, читайте пап +е3*. 


1Е [ ! -е а беѕі ће ]; ЕВеп есһо беѕі Й1е Һай пос ехіѕіеа; ~ 
соисп а безі й1е; е1зе есһо беѕі е ехіѕіей; гт а безі йе; й 


Поскольку очень много программ придерживается соглашения нуль=ОК, а не- 
нуль==проблема, то мы можем использовать предложения 11 без {ез\, чтобы вы- 
разить мысль если программа завершилась нормально, то... . Например, нередко 
применяют команду *аг, чтобы архивировать каталог в один файл . д2, а затем ка- 
талог удалить. Будет весьма печально, если {аг-файл по какой-то причине создать 
не удастся, а содержимое каталога все равно сотрется. Поэтому перед удалением 
нужно проверить, что їаг завершилась успешно: 


# Создадим несколько тестовых файлов 
ткаіг а беѕі аіг 
есһо безііпд ... беѕііпд > а беѕі аіг/Се 
# Архивируем их и удалим, но только если архивирование прошло успешно 
1Ё баг с2 а беѕі аіг > агсһічеа.ід2; іһеп 
есһо Сотргеѕѕіоп меп ОК. Кетоуіпд Яігесіогу. 
гт -г а беѕі аіг 
е1ѕе 
есһо Сотргеѕѕіоп Ёа11е4. Бо1па поёһіпд. 
В 


Если вы хотите посмотреть, как после первого прогона второй завершается не- 
удачно, выполните команду сһтоа 000 агсһічеа. 92, которая сделает запись в конеч- 
ный архив невозможной, и запустите скрипт снова. 

Не забывайте, что во всех показанных выше вариантах анализируется возвра- 
щаемое программой значение – с помощью *е5* или иным способом. Но иногда 
требуется получить то, что программа выводит, и тут на помощь приходят обрат- 
ные апострофы. Например, команда саї уоџгі]е | ис -1 порождает одно число - ко- 
личество строк в файле уоиг е (в предположении, что он существует), и это число 
можно проверить следующим образом: 


1Е [ `саё уоџгі1е | мс -1` -еа 0 ] ; ЕВеп есһо епреу В1е.; В 


Настроим мультиплексор 


У меня во время кодирования всегда открыты два терминала: в одном редактор с тек- 
стом программы, а в другом я компилирую и запускаю программу (возможно, в отлад- 
чике). А если исходных файлов несколько, то возникает настоятельная необходимость 
в удобном механизме перехода от одного терминала к другому. 

Существуют два популярных терминальных мультиплексора по обе стороны от барьера, 
разделяющего вечных соперников, СМИ и В50: СМИ Зсгееп и їітих. Менеджер пакетов, 
скорее всего, сможет установить оба. 
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У обеих программ имеется единственная управляющая клавиша. В СМУ Зсгееп это по 
умолчанию Сїгі-А, а в {тих – Сїгі-В, но по общепринятому соглашению все переназна- 
чают клавишу на Сїгі-А с помощью добавления следующих команд: 


опріпа с-Ь 
ѕе -9 ргейх С-а 
ріпа а зепа-ргейх 


в файл .ітих соп в домашнем каталоге. В руководствах описаны еще десятки настро- 

ек в конфигурационных файлах. Кстати, когда будете искать советы и документацию, 

набирайте в поисковике СМИ Ѕсгееп, потому что по одному лишь слову 5сгееп ничего 
полезного вы не получите. 

Если в качестве управляющей клавиши задана Сїгі+А, то нажатием Сїгі+А Сїгп1+А про- 

изводится переход между двумя окнами, а в руководстве можно прочитать о прочих 

комбинациях Сїгі+А с другими клавишами, в частности отом, как перемещаться вперед 

и назад по списку окон и как вывести весь список окон, чтобы можно было выбрать из 

него нужное. 

Таким образом, оба мультиплексора решают проблему нескольких окон. Но этим они 

отнюдь не ограничиваются. 

• Комбинация Сїгі+А О отсоединяет сеанс, то есть на вашем терминале больше не 
отображаются различные виртуальные терминалы, управляемые мультиплексором. 
Но они продолжают работать в фоновом режиме. 

— В конце долгого рабочего дня в компании СМИ Зсгееп/Ттих отсоедините сеанс. 
А позже из дома или завтра утром присоедините его снова командой ѕсгееп -г или 
{пих аёќасћ,и вы окажетесь точно там, где прервались. Возможность продолжать 
работу после отсоединения удобна и в случае неустойчивого подключения к сер- 
веру где-нибудь в Белизе или в Украине. 

— Мультиплексор не прерывает работу программ в своих виртуальных терминалах 
после отсоединения, что полезно, когда нужно запустить длительный процесс на 
ночь. 

• Существует возможность копирования и вставки. 

— Находясь в режиме копирования, вы можете без использования мыши пролистать 
все, что недавно показывалось на экране терминала, выделить какой-то фрагмент, 
скопировать его во внутренний буфер обмена мультиплексора, а затем вставить 
скопированный текст в командную строку. 

— Просматривая текст в режиме копирования, вы можете перелистывать историю и 
искать строки. 

Мультиплексоры - это последний шаг на пути превращения терминала из места работы 

в приятное место работы. 


Команда {С 


Команда Е (описанная в стандарте РОЅІХ) превращает текст, набранный ру- 
ками в оболочке, в допускающий повторное использование скрипт. Давайте по- 
пробуем. 


Ес -1 # Флаг [ означает “список”, он важен 


Теперь на экране появляется пронумерованный список нескольких последних 
команд. Возможно, в вашей оболочке того же эффекта можно достичь с помощью 
команды һіѕёогу. 

Флаг -п подавляет вывод номеров строк, следующая команда выводит в файл 
элементы истории с номерами от 100 до 200: 


Ес -1 -п 100 200 > а ѕсгірё 
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После этого можно удалить из файла строки, знаменующие неудачные экспери- 
менты, и тем самым превратить бестолковые игрища в командной строке в акку- 
ратный скрипт оболочки. 

Без флага -1 команда Ёс становится более оперативным, но и менее постоянным 
инструментом. Она подгружает редактор (это означает, что перенаправление вы- 
вода с помощью > приведет к кажущемуся зависанию), отключает вывод номе- 
ров строк и при выходе из редактора немедленно выполняет все введенные в нем 
команды. Это очень удобно для быстрого повтора нескольких последних строк, но 
может привести к катастрофическим последствиям в случае небрежности. Если 
вы поняли, что забыли указать флаг -1, или недоумеваете, почему вдруг оказались 
в редакторе, немедленно удалите все находящееся на экране, чтобы случайно не 
выполнить то, что для выполнения не предназначено. 

Но закончим все же в позитивном ключе: Ес расшифровывается как Их соттапа 
(исправить команду), и это ее самое простое применение. Без каких-либо флагов 
она позволяет редактировать только предшествующую строку; это удобно, когда 
нужно внести в команду нетривиальные исправления. 


Пробуем другую оболочку 


Помимо оболочки, которую поставщик вашей системы решил выбрать по умолчанию, 
в мире существует много других. Здесь я опишу кое-какие интересные вещи, которые 
умеет делать оболочка 2, – просто чтобы вы поняли, что может дать отказ от баѕћ. 
Перечни возможностей и переменных оболочки 2 занимают несколько десятков стра- 
ниц, экономии в ней не место - да и зачем по-спартански относиться к удобствам, кото- 
рые несет с собой интерактивность? (Если вам больше по душе спартанская эстетика, 
но при этом вы все же хотите уйти от баѕћ, попробуйте аѕћ.) Задайте переменные в фай- 
ле -/. 2зйгс (или просто введите в командной строке для экспериментов); ниже показана 
переменная, которая понадобится в последующих примерах: 


ѕесорі ТМТЕВАСТТУЕ СОММЕМТ5 
# такие комментарии не приводят к ошибке 


Расширение имен по маске, например замена ї1е.* последовательностью Ё]е.с #]е.о 
Ёе.һ – обязанность любой оболочки. Но в 25ћһ имеется полезное дополнение: ** / 
означает, что оболочка должна при расширении по маске рекурсивно обойти дерево 
каталогов. Согласно РОЯХ, вместо знака ~ подставляется домашний каталог, поэто- 
му если вы хотите найти все с-файлы в своей области файловой системы, наберите 
15 ~/%%*/%.с, 

Давайте сделаем резервные копии всех своих с-файлов: 


# Эта строка может создать множество файлов в самых разных местах домашнего каталога 
Ғог ЕЕ іп -/**/*.с; ао ср $ЕЕ ${ЕЁ}.ЬКир; опе 


Как вы, наверное, помните, в Баѕћ реализована только целочисленная арифметика, то 
есть $ ((3/2)) всегда равно 1. Оболочки 25ћ и К$П (и некоторые другие) похожи в этом 
отношении на С, то есть дают вещественный результат, если привести числитель или 
знаменатель к типу с плавающей точкой: 


есһо $((3/2.)) # работает в 25й, синтаксическая ошибка в Баѕћ 
# Повторим приведенный ранее пример с подсчетом строк: 


Е11е5=`1$ *.с [мс -1` 
1 пез=`дгер '[)};]'*.с | мс -1` 
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# приводим к типу с плавающей точкой путем сложения с 0.0 
есһо 11пез/Ё1е = $ (($1іпеѕ/ ($Е11ез+0.0))) 


Пробелы в именах файлов могут привести к ошибкам в баѕћ, потому что пробелы раз- 
деляют элементы списка. В 25ћ имеется синтаксис массива, не зависящий от исполь- 
зования пробела в качестве разделителя элементов. 


# Создаем два файла, в имени одного из них есть пробелы 
есһо ©1 > "безе П1е 1" 
есһо #2 > "беѕі Н1е 2" 


# Дает ошибку в Бай, работает в 25й. 
Еог Е іп беѕі* ; Яо са $Ё; аопе 


Сменить оболочку можно двумя способами: с помощью команды сћћ сделать измене- 
ние узаконенным на уровне входа в систему (меняется файл /еѓс/раѕѕиа!) или, если это 
почему-либо проблематично, добавить команду ехес -1 /иѕг/ріп/25ћ (вместо 25ћ можете 
указать любую другую оболочку) в последней строке файла .Баѕћгс, в результате чего 
баѕћһ будет заменять себя указанной оболочкой при каждом запуске. 

Если вы хотите, чтобы в такейе использовалась нестандартная оболочка, то включите 
в него строку: 


ЅНЕ=соттапа -у 25һћ 


(или укажите другую оболочку). Описанная в РОЅІХ команда соплапі -у выводит полный 
путь к указанной команде, такчто помнить его необязательно. 5НЕШ – необычная пере- 
менная в том смысле, что она должна быть задана либо в самом таке#е, либо в виде 
аргумента паке, поскольку переменную окружения с именем НЕШ паке игнорирует. 


Файлы такейіе и скрипты оболочки 


Наверное, в каждом проекте существует уйма мелких процедур (подсчет слов, 
проверка правописания, прогон тестов, сохранение в системе управления версия- 
ми, выгрузка из системы управления версиями на удаленный сервер, резервнос 
копирование), которые можно было бы автоматизировать с помощью скрипта 
оболочки. Но вместо того чтобы заводить по файлу из одной-двух строк на каждое 
задание, все это можно поместить в один таке е. 

Файлы таКкеЁіе обсуждались в разделе «Работа с файлами таКкеЁе» выше, но 
теперь, больше узнав об оболочке, мы поговорим о том, что еще может находиться 
в этих файлах. Ниже приведен пример из моей практики, в котором используются 
конструкция оболочки 1Ё/Пеп и команда {ез*. Сам я работаю с СЁ, но мне при- 
ходится иметь дело с тремя репозиториями ЗиБуегз!оп, а названия и порядок вы- 
полнения команд Ѕибуегѕіоп я постоянно забываю. Зато их помнит таке ]е. 


Пример 3.4 * Использование #АВеп и їеѕї в таке#е (глаке_Ыій) 


разн: 
@1Е [ "х$ (М56)" = 'х' ] ; еп \ © 
есһо "Оѕаде: М5б='уоиг теѕѕаде Веге.' таке ризН"; й 
@еезЕ "х$ (М56)" != 'х' 


ді соттіё -а -т "$ (М56) " 
9і ѕуп Ғеёсһ 
91 ѕуп гераѕе 
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91Е ѕуп асоттіб 


ро11: 
91Е ѕуп Ёеёсһ 
91Е зуп гераѕе 


© Каждая операция фиксации должна сопровождаться сообщением, которое пе- 
редается в переменной окружения, задаваемой в командной строке: М5б="ТВ1$ 15 
а соті." паке риѕћ. Эта строка в предложении іѓ-їћеп печатает напоминание, 
если я забуду задать сообщение. 

Ө Проверяю, что результат подстановки в строку "х$ (М6) " содержит что-нибудь, 
кроме "х", то есть строка $ (М6) не пуста. Добавление х в строке по обе стороны 
знака равенства предотвращает ошибку в случае, когда $ (М6) пуста. Если про- 
верка не проходит, то паке больше ничего не делает. 


Команды, запускаемые из таке е, в одних отношениях практически совпадают 
с запускаемыми непосредственно из командной строки, а в других кардинально 
отличаются. 
О Каждая строка работает независимо от всех остальных, в отдельной оболоч- 
ке. Если вы напишете в паКей1е такие строки: 
с1еап: 


са јопкаіг 
гт -Ё * # Не включайте такую команду в чтаќејіе. 


то вас постигнет глубокое разочарование. Эти строки эквивалентны такому 
коду на С: 


ѕуѕёет ("са јопкаіг"); 
зузеем ("гм -Ё *"); 


Или поскольку ѕуѕіет ("спа") эквивалентно 31 -с "сті", то наш код в таке е 
эквивалентен такому: 


ЗВ -с "са јопкаіг" 
ЗН -2 ТЕ Е ж" 


Знатоки оболочки знают, что конструкция (сп) запускает спа в подоболоч- 
ке, поэтому рассматриваемый фрагмент эквивалентен таким командам, вве- 
денным непосредственно в командной строке: 


(са )ипка1г) 
(кт -Ё *) 


Во всех случаях вторая подоболочка ничего не знает о происходящем в пер- 
вой. паке сначала запускает новую оболочку, та переходит в каталог, кото- 
рый вы собираетесь очистить, после чего завершается. Затем паке запускает 
еще одну оболочку, причем текущим является тот каталог, из которого была 
запущена сама команда паке, и в ней вызывает гп -Е *. 

Есть в этой ситуации и плюс – паке удалит неправильно написанный таКе- 
Ќе. А чтобы выразить первоначальное намерение, нужно написать: 
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са јопкаіг && гт -Ё * 


где оператор & осуществляет такое же короткое замыкание, как в С (то есть 
если первая команда завершается с ошибкой, то вторая не запускается). 
Или можно воспользоваться обратной косой чертой, чтобы соединить две 
строки в одну: 


са јопкаіг&в& \ 
а = * 


Впрочем, я в подобных случаях не стал бы доверять обратной косой черте. 
На практике гораздо надежнее написать гп -Ё јопкаіг/*. 

О паке заменяет вхождения $х (односимвольные имена переменных) или $ (хх) 
(двухбуквенные имена переменных) значениями соответствующих пере- 
менных. 

О Есливы хотите, чтобы подстановку выполняла оболочка, а не паке, опустите 
скобки и каждый знак $ замените двумя ($$). Например, чтобы с помощью 
оболочки создать резервные копии файлов из таке е, нужно написать: Ёог 
і ш*.с; до ср $$1 $${13%.с}.БКир; аопе. 

О Вспомните рассмотренный выше прием - задание переменной окружения 
непосредственно перед командой, например СЕЬАб5=-03 дсс іеѕі.с. Это может 
оказаться полезным в ситуации, когда каждая оболочка существует толь- 
ко на протяжении работы одной команды. Не забывайте, что присваивапие 
должно располагаться прямо перед командой, а не перед ключевым словом 
оболочки типа 14 или нћі]е. 

Знак ё в начале строки означает, что команду нужно выполнить, но печатае- 
мые ей сообщения на экран не выводить. 

Знак - в начале строки означает, что даже если данная команда возвращает 
ненулевое значение, выполнение все равно нужно продолжать. По умолча- 
нию работа таке е останавливается после первой же команды, вернувшей 
ненулевое значение. 

Для простых проектов и большинства повседневных проблем применение воз- 
можностей оболочки в такеЁе может дать очень много. Вы знаете причуды свое- 
го компьютера, и таке е позволяет учесть их в одном месте и больше о них не 
думать. 

Будет ли ваш таке @е полезен коллегам? Если ваша программа представляет 
собой обычный набор с-файлов, если все необходимые библиотеки уже установ- 
лены и если переменные СЕІАСЅ и 101185 в файле таке е соответствуют системе 
коллеги, то, быть может, все заработает нормально, а в худшем случае потребуется 
раз-другой связаться по электронной почте и уточнить детали. Если же вы генери- 
руете разделяемую библиотеку, то дажене думайте передавать свой таке е – про- 
цедуры создания такой библиотеки на платформах Мас, Глпих, УЛп4до\з, 50[аг!$ 
и даже на разных версиях одной платформы очень сильно различаются. Предла- 
гая свое творение широкой публике, нужно все автоматизировать по максимуму, 
потому что переписываться по поводу флагов с десятками или сотнями людей 
тяжеловато, да и большинство потенциальных пользователей просто не захочет 
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тратить столько времени и сил на то, чтобы заставить работать код, написанный 
каким-то незнакомцем. Поэтому для публично распространяемых пакетов необ- 
ходим еще один слой программного обеспечения. 


Созлание пакета с помошью АЩщЩоюо5 


АисоѓооЇ5 — это как раз то, что позволяет вам скачать библиотеку или программу 
в исходных кодах и выполнить такие команды: 
./сопйаиге 


таке 
зи4о таке іпѕба11 


(и ничего больше) для ее сборки и установки. Только подумайте, до каких чудес 
дошла современная наука: разработчик понятия не имеет, какой у вас компьютер, 
где находятся ваши программы и библиотеки (в /057/Ріт? в /50? в /сувапое/с/ 
п?) и какие еще причуды характерны для вашей машины, и тем не менее скрипт 
сопйдиге во всем разобрался и сгенерировал работающий такеЁІе. Таким образом, 
Аибоб00]5 — на сегодня основной способ распространения кода. Если вы хотите, 
чтобы человек, незнакомый с вашим кодом, пользовался им (или чтобы ваша про- 
грамма была включена в репозиторий пакетов какого-то дистрибутива Гіпих), 
то использование Аибобо0| для сборки пакета сильно повышает ваши шансы на 
успех. 

В сети полно пакетов, которым для установки нужен какой-то определенный 
каркас, например Ѕсһете, Руіһоп версии 22.4, но <3.0, менеджер пакетов Кей На 
Раскаре Мапарег (КРМ) ит. д. Каркас облегчает пользователям задачу установки 
пакета, только сначала нужно установить сам каркас. Для пользователей, не имею- 
щих привилегий администратора, такое требование может оказаться чрезмерным. 
Ацщсотоо[$ выделяется тем, что довольствуется совместимостью компьютера поль- 
зователя со стандартом РОЅІХ. 

Владение АиќоѓооЇѕ в совершенстве требует изрядных навыков, но основы прос- 
ты. К концу этого раздела мы напишем скрипт сборки из шести строк, выполним 
четыре команды и получим полный (хотя и примитивный) пакет, готовый к рас- 
пространению. 

История развития Аџѓќосопі, Аиотаке и 1Ьёооі довольно запутанна: это разные 
пакеты, и, в принципе, можно использовать их поодиночке. Но вот как я представ- 
ляю себе эволюцию. 

Менон. Люблю я паке. Ах, какэто прелестно – собрать водном месте все мелкие 
шажки, необходимые для сборки проекта. 

Сократ. Да, автоматизация — великое дело. Автоматизировать нужно все. 
И всегда. 

Менон. В моем таке йе куча целей, пользователь может набрать просто паке, 
чтобы создать программу, или паке 1п5*а11 — чтобы установить ее, или паке сһеск – 
чтобы прогнать тесты, да мало ли... Написать все эти цели было трудненько, зато 
пользоваться — одно удовольствие. 
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Сократ. Так, а напишу-ка я систему – назову ее Аиботаке, которая будет ав- 
томатически генерировать файлы таке е со всеми обычными целями из очень 
коротенького пра-такеЁе. 

Менон. Отличная мысль. Особенно противно строить разделяемые библиоте- 
ки, потому что в каждой системе это делается по-своему. 

Сократ. Воистину противно. Имея информацию о системе, я смогу написать 
программу генерации скриптов, потребных для создания разделяемых библио- 
тек из исходного кода, азатем включить их в файлы таке е, порожденные Аио- 
таке. 

Менон. Здорово! Значит, мне остается только сказать тебе, какая у меня опе- 
рационная система и как называется мой компилятор - сс, с|апр, рсс, или как-то 
еще - иты включишь код, соответствующий моей системе. 

Сократ. Э-э, так и до ошибок недалеко. А я вот напишу систему, скажем 
Аиќосопѓ, которая будет знать обо всех существующих системах и генерировать 
отчет, содержащий все, что Ашотаке и твоя программа должны знать о системе. 
Тогда Ашбосоп сможет запустить Ашотаке, который воспользуется сведениями в 
моем отчете, чтобы создать таКеШе. 

Менон. Я просто поражен – ты автоматизировал процесс автогенерации таке- 
Не. Получается, что теперь мне нужно не изучать особенности различных плат- 
форм, а писать конфигурационные файлы для Ащосоп{ и шаблоны такее для 
Аиботаке. 

Сократ. Ты прав. А я должен буду написать инструмент, имя ему Ацбобсап, ко- 
торый просмотрит файл Маке/йе.ат, подготовленный тобой для Ащотаке, и ав- 
томатически сгенерирует файл сопЙвите.ас для АиѓосопЁ. 

Менон. И, стало быть, останется только автоматически сгенерировать Маѓе- 
Ше.ат. 

Сократ. Вот-вот. Читай документацию и сделай это сам. 

На каждом шаге этой истории добавляется еще немножко автоматизации к до- 
стигнутому на предыдущем шаге. Ашотаке с помощью простого скрипта гене- 
рирует файлы таке е (которые и так уже являются большим шагом вперед в 
деле автоматизации компиляции, по сравнению с набором команд вручную); 
Ацбосоп{ проверяет свое окружение и использует собранную информацию для 
запуска Ашотаке; Ашозсап просматривает ваш код и сообщает, что необходи- 
мо для успешной работы АиќосопЁ [100] остается в тени и незаметно помогает 
АиботакКе. 


Пример работы с АШо{тоо!$ 


В примере 3.5 приведен скрипт, с помощью которого Аиѓоѓоо! сделает все необ- 
ходимое для программы Нео, Миа. Это скрипт оболочки, который вы можете 
скопировать в командную строку (позаботьтесь только, чтобы после знаков об- 
ратной косой черты не было пробелов). Разумеется, прежде всего нужно с по- 
мощью менеджера пакетов установить все части Ацѓоѓоо]5: Аиосоп Ашотаке 
и 11Ьќоо]. 
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Пример 3.5 * Сборка пакета программы Не!о, Моа (ащо.соп?) 
1Е [ -е аџёойето ]; ёһћеп гм -г аџёодето; й 

ткаіг -р аикодето © 

са аџёодето 

саб > Ве]11о.с <<\ 


#іпс1џае <ѕаіо.һ> 


іп таіп () { ргіпеё ("Ні.\п"); } 


Ь1п_РВОСКАМ$ =пе11о 
Һе110 ЅООКСЕЅ=һе110.с 


Аџёоѕсап 9 
зе -е 'з/РОЬЪ-РАСКАСЕ-МАМЕ/Ве110/' \ 
-е 'з/\ЕВ$ТОМ/1/' \ ө 
-е '5| ВОС-КЕРОКТ-АРркЕ$5 | /4еу/пи11|' \ 
-е '101\ 


АМ_ТМТТ_АОТОМАКЕ' \ 
< сопйдиге.зсап > сопНаиге.ас 


Соџсћ МЕМ$ КЕАРМЕ АОТНОК$ Сһапде1од 5) 
аџсогесопЁ -іу ө 
./сопідиге 


паке аіѕёсһеск 


97 


© Создать каталог и с помощью встроенного документа записать в него файл 


ре|о.с. 


Ө Нам понадобится написанный вручную файл Маѓе/йе.ат, состоящий всего из 
двух строк. Даже строка ће110 500КСЕЅ необязательна, потому что Ашотаке мо- 


жет догадаться, что программа Ае//о строится из исходного файла йе//о.с. 
Ө аџіоѕсап генерирует файл сопйрите.5сап. 


© Отредактировать файл сопЙрите.5сап — включить в спецификацию параметры 
вашего проекта (название, версию, контактный адрес электронной почты) и до- 
бавить строку АМ ІМІТ АОТОМАКЕ для инициализации Ашотаке. (Да, это стран- 
но, особенно принимая во внимание, что Ацозсап пользовался относящимся 
к Аиѓотаке файлом Майе Ше.ат для сбора информации, поэтому он прекрасно 
знает, что мы собираемся работать с Ашотаке.) Можно было бы сделать это 
вручную; я воспользовался потоковым редактором ѕей, чтобы вписать нужный 


мне номер версии прямо в сопЙвите.ас. 


Ө Наличия этих четырех файлов требует стандарт кодирования СМО, а потому 
СМУ просто отказывается работать без них. Я смошенничал – создал пустые 
файлы с помощью стандартной команды Ёоиџсһ; в ваших файлах должна присут- 


ствовать реальная информация. 
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Ө Имея файл сопНриге.ас, запускаем ацкогесопЕ, чтобы сгенерировать все файлы, 
нужные для распространения (и в первую очередь сопйдиге). При наличии фла- 
га -1 создаются дополнительные стереотипные файлы, необходимые системе. 


Что создают все эти макросы? Сам файл йеЦо.с занимает всего три строки, 
МаеН.ат и того меньше - две строки, так что руками пользователя написано 
пять строчек. Что касается остального, то команда ис -1 *, запущенная в каталоге 
после завершения работы скрипты, насчитала примерно 11 000 строк текста, из 
которых 4700 пришлось на скрипт сопйдиге. На вашей машине результаты могут 
немного отличаться. 

Такой немаленький размер объясняется переносимостью: у получателей пакета 
может не оказаться АиѓоѓооЇѕ, и одному Богу известно, чего еще у них нет, поэтому 
созданный скрипт может полагаться только на средства, требуемые стандартом 
РОЅІХ. 

В файле такеЁІе из 600 строк я насчитал 73 цели. 

О Цель по умолчанию, которая строится, когда введена только команда паке 

без параметров, она порождает исполняемый файл. 

О Команда 540 паке 1п$+а11 установит программу, если вы захотите. Команда 
$40 таке ип1п5{а11 удалит ее. 

О Существует даже взрывающая мозг цель паке Макећ1е (она бывает полезна, 
если вы подправите файл Майей [е.ат и захотите быстро перегенерировать 
такейе). 

О Автору пакета интересна цель таке 915% сВеск, которая генерирует {аг-файл, 
содержащий все необходимое пользователю для распаковки и запуска 
обычной последовательности команд ./сопНдиге && паке && зидо таке іпѕїа11 
(без помощи со стороны системы Ашёотоо[5, которая имеется на машине, где 
вы ведете разработку) и проверяет правильность собранного дистрибутива, 
в том числе прогоняет заданные вами тесты. 

На рис. 3.1 вся эта история представлена в виде блок-схемы. 

Вам предстоит написать только два из показанных файлов (в закрашенных 
блоках), все остальное генерируется автоматически соответствующей командой. 
Начнем с нижней части: пользователь получает ваш пакет в виде (57-файла и рас- 
паковывает его командой {аг ху2Ё уоџг рко. 92, которая создает каталог, содержа- 
щий ваш код, файлы Маке е.ат, сопйвиге и еще ряд вспомогательных файлов, 
которые мы здесь обсуждать не станем. Пользователь вводит команду ./сопйдиге, 
она генерирует файлы сопЙрите.й и Маке/Ше. Теперь все готово к вводу команд 
паке; $и40 таке 1п5%а11. 

Задача автора — сгенерировать &57-файл, содержащий высококачественные 
файлы сопЙриге и Маке[йе.ат, при запуске которых у пользователя не возник- 
нет никаких проблем. Для начала напишите сами файл Маке Ше.ат. Выполните 
аџёоѕсап и созданный предварительный файл сопјірдиге.ѕсап отредактируйте вруч- 
ную, чтобы получить сопјівиге.ас. (На схеме не показаны четыре файла, требуемых 
согласно стандартам кодирования СМО: МЕ\/5, КЕАОМЕ, АИТНОК5и СйапвеГовр). 
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уошг_рко.(92 


Пользователи 


усиг_рКд.197 


Рис. 3.1 < Блок-схема АиїоїооІ5. 
Вам нужно написать только два из показанных файлов (в закрашенных блоках), 
все остальное генерируется автоматически соответствующей командой 


Затем выполните команду аџіогесопї -іт, которая создаст скрипт сопйдиге (и много 
других вспомогательных файлов). Этот скрипт можно теперь запустить и полу- 
чить таке е, а имея такеЁІе, выполнить паке діѕёсһеск для генерации дистрибу- 
тивного {57-файла. 

Обратите внимание на некоторое перекрытие: вы используете те же файлы 
сопЛвиге и Майе ЩЕ, что и пользователь, только ваша цель — собрать пакет, а цель 
пользователя – этот пакет установить. Это означает, что у вас имеются средства 
установить и протестировать код, не собирая полного пакета, а у пользователя – 
возможность пересобрать пакет по-другому, если возникнет такое желание. 
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Описание Макейіе с помощью МакеНе.ат 


Типичный таке е наполовину описывает структуру зависимостей частей вашего 
проекта друг от друга, а на другую половину содержит разного рода переменные 
и исполняемые процедуры. Ваш файл Маке/Ше.ат должна в первую очередь инте- 
ресовать структура – что подлежит компиляции и что от чего зависит, а конкрет- 
ные детали подставят Аџќосопѓ и Ашотаке, руководствуясь встроенными в них 
знаниями о компиляции на различных платформах. 

В Майе е.ат есть два типа информации, которые я буду называть переменными 
формы и переменными содержания. 


Переменные формы 


У файлов, которые должны быть обработаны с помощью таКећіе, может быть 
различное назначение, и в Ашотаке для каждого назначения предусмотрена ан- 
нотация в виде короткой строки. 

Біп 

Установить туда, где находятся другие программы, например в /и57/іп или 

в /и5'/Лоса[/ іп. 

іпсіийе 

Установить туда, где находятся заголовки, например в /и57;/оса[Лпсіийе. 

НЬ 

Установить туда, где находятся библиотеки, например в /иѕ/Їоса/[/!Ь. 

ркађіп 

Если проект именованный, установить в подкаталог каталога с главной про- 

граммой, например в /57;/оса//Біп/рғојесі/ (и аналогично для рёріпсіийе и 

реН). 

сресЁ 


Используется для тестирования программы, когда пользователь вводит комап- 
ду паке сһеск. 


поіпѕі 
Не устанавливать, просто оставить файл, он будет нужен для обработки другой 
цели. 


Ашботаке генерирует стереотипные скрипты для паке и имеет различные шаб- 
лоны для следующих разделов: 


РКОСКАМ$ 

НЕАОЕВ$ 

ІВВАВІЕЅ статические библиотеки 

ЬТЫВВАВТЕ$ разделяемые библиотеки, сгенерированные Ііђёоо! 

015Т файлы, распространяемые вместе с пакетом, например файлы данных, которые ни в какую 


другую категорию не попадают 


Назначение плюс шаблонный формат - это и есть переменная формы, на- 
пример: 
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рі п РКОСКАМЅ программы, которые нужно собрать и установить 

сһеск РКОСКАМЅ программы, которые нужно собрать для тестирования 

іпс1џде НЕАРЕАЅ заголовки, которые нужно установить в системный каталог іпсіийе 

116 ЬТЫВВАВТЕ$ динамические и разделяемые библиотеки, собираемые с помощью 1161001 

по1пзЕ 11ВВАВТЕ$ статические библиотеки (собираемые без участия 11Ь001), которые могут понадобиться 


позднее 
поіпзё рІѕТ распространять с пакетом, но и только 
русһоп_РҮТНОМ написанный на Руѓћоп код, который нужно откомпилировать в байт-код и установить 


туда, куда устанавливаются пакеты на Руйоп 


Определившись с формой, мы можем воспользоваться этими переменными, 
чтобы указать, как должен обрабатываться каждый файл. В нашем примере пакета 
"Нео, Мог!" был всего один файл: 


ріп РКОСКАМЅ = ће110 


В качестве другого примера рассмотрим раздел поіпѕї 0157, в котором описы- 
ваются данные, необходимые для тестов, прогоняемых после компиляции, - уста- 
навливать их никуда не нужно. В каждой строке может быть перечислено произ- 
вольное количество файлов. Например: 
ркдіпсіџде НЕАРЕВЅ = їігзёрагі.ћһ ѕесопарагё.һ 


поіпѕє рІЅТ = ѕатріе1.сѕу ѕатр1е2.сѕу \ 
ѕатріе3.сѕу ѕатр1е4.сѕу 


Переменные содержания 


Элементы из раздела поіпѕї 0157 просто копируются в дистрибутивный пакет, 
а из раздела НЕАрЕКЅ — копируются в конечный каталог с установкой соответст- 
вующих разрешений. С ними, стало быть, все ясно. 

Для выполнения шагов компиляции, например „РКОСВАМ и ... ГОЫВВАЕТЕ$, 
Аиботаке должен знать многочисленные детали. Как минимум необходимо знать, 
какие исходпые файлы компилировать. Следовательно, для каждого элемента 
справа от знака равенства в строке переменной формы, относящейся к компиля- 
ции, нужна переменная, определяющая исходные файлы. Например, для компи- 
ляции следующих двух программ нужны две строки 5008СЕ5: 
ріп РКОСКАМ5= меакпег ихргеаісе 


меаёћег ЅО0КСЕЅ= бетр.с Баготеѓбег.с 
мхргедӢісі ЅО0КСЕЅ5=гпд.с багоѓаеск.с 


Для простого пакета этим все может и исчерпываться. 


ГА Здесь мы имеем еще одно нарушение принципа, согласно которому вещи, предназначен- 

/ : \ ныедляразных целей, должны и выглядеть по-разному: переменные содержания записы- 

ваются в таком же виде Іомег ОРРЕК, как и переменные формы, но образуются из совер- 
шенно других частей и служат совершенно другим целям. 


Напомним: обсуждая старые добрые файлы такеЁе, мы упомянули, что в паке 
встроен ряд правил по умолчанию, в которых переменные типа СЕТАб$ использу- 
ются для настройки деталей операций. Переменные формы Ашотаке по существу 
определяют дополнительные правила по умолчанию, и с каждым из них ассоции- 
рован свой набор переменных. 
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Например, правило компоновки объектных файлов в исполняемые может вы- 
глядеть следующим образом: 


$(СС) $(ЬОЕЬАС$) бетр.о Багомееег.о $ (1рАрр) -о меаёћег 


В программе СМИ Маке во второй части команды компоновки используется переменная 
| 1011В5, ав СМУ Аџїотаке – переменная 10А00. 


С помощью поисковика нетрудно найти в Интернете документацию, в кото- 
рой объясняется, как из той или иной переменной формы получается набор це- 
лей в итоговом такеШе, но мне кажется, что самый простой способ выяснить, 
что делает Ашотаке, – просто запустить программу и изучить сгенерированный 
такейе в редакторе. 

Все эти переменные можно установить на уровне одной программы или библио- 
теки, например неаёћег СРІАб5=-01. Либо воспользоваться переменной АМ УАВТАВЬЕ, 
чтобы установить одно и то же значение для всех операций компиляции или ком- 
поновки. Вот как можно задать мои любимые флаги компилятора, описанные 
в разделе «Работа с файлами таке е» выше: 


АМ СЕАбЅ=-9 -Ма11 -03 


Я не включил флаг -5#1=9п099, заставляющий 5сс придерживаться не столь 
устаревшего стандарта, поскольку этот флаг зависит от компилятора. Если бы я 
добавил в файл сопјіриғе.ас макрос АС РАОС СС С99, то Ашосоп{ присвоил бы пере- 
менной СС значение дсс -561=9п099. Ацѓоѕсап (пока) недостаточно сообразителен, 
чтобы самостоятельно включить эту директиву в генерируемый файл сопДрите. 
ѕсап, так что ее, вероятно, придется добавить вам. (На момент написания этой кни- 
гиеще не существовало макроса АС РКОС СС С11'.) 

Более специфичные правила переопределяют правила, основанные на макро- 
сах вида АМ , поэтому если вы хотите придерживаться общих правил, но переопре- 
делить какой-нибудь флаг в конкретном случае, то нужно поступить следующим 
образом: 


АМ СЕАбЅ=-9 -Ма11 -03 
һе110 СЕГАбЅ = $ (АМ_СЕЬАС$) -00 


Добавление средств тестирования 


Я еще не рассказал о библиотеке для работы со словарями (она рассматривастся 
в разделе «Расширение структур и словарей» на стр. 251), но продемонстрировал 
тестовую оснастку для нее в разделе «Автономное тестирование» выше. После 
того как АиќоѓооЇѕ соберет библиотеку, тесты имеет смысл прогнать еще раз. Таким 
образом, нам предстоит собрать: 
О Библиотеку, включающую откомпилированные файлы сс и Кеува[.с. 
С ней ассоциированы заголовки (4сёЙ и Реуоаї.ћ, которые нужно распро- 
странять вместе с библиотекой. 


' В 2012 году этот макрос был добавлен. – Прим. перев. 
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О Тестовую программу, причем АиѓотаКе должен знать, что она предназначе- 

на именно для тестирования и устанавливать ее не нужно. 

О Программу дісі џѕе, которая пользуется библиотекой. 

Эта повестка воплощена в жизнь в примере 3.6. Первой собирается библиотека, 
чтобы ее можно было использовать при сборке программы и тестовой оснастки. 
Переменная 7Е575 определяет, какие программы или скрипты должны запускать- 
ся, когда пользователь вводит команду паке спеск. 


Пример 3.6 < Файл АшотакКе, в котором учтено тестирование (аісї.аџиїотаке) 
АМ СЕІАС5=`ркд-сопіід --сПадз 911р-2.0` -9 -03 -Ма11 ® 


11р ІТІІВВАВІЕЅ=11Ьдісё.1а ө 
1іраісі Ја 800ВСЕЅ=аіс.с Кеууа1.с © 


1пс1и4е_НЕАБЕВ$=Кеууа1.п аісё.һ 


Ь1п_РВОСВАМ$=а1сЕ_изе 
91сЕ_изе_$00ВСЕ$=91сЕ џѕе.с 
91сЕ_изе_ЬОАО=11Ь91с* .1а 9 


ТЕЅТ5=$ (спеск_РВОСВАМ$) 5] 
сһеск РКОСКАМЅ=аісі ГсеѕЕ 
аісе беѕі ІрАрр=11раісё. 1а 


© Я немного смошенничал, потому что у других пользователей программы рКке- 
сопй= может не оказаться. Без предположения о наличии рке-сопћр лучшее, 
что можно сделать, — проверить присутствие библиотеки с помощью макро- 
сов АшосопЕ АС СНЕСК НЕАОЕВ и АС СНЕСК ГВ, и если она не найдена, то попро- 
сить пользователя изменить переменные окружения СЕГАС$ или БОЕЬАб5, указав 
в них правильные флаги -І или -1. Поскольку мы еще не дошли до обсуждения 
сопјћівиг.ас, я просто воспользуюсь рке-сопіе. 

Ө Первым делом мы должны собрать разделяемую библиотеку (с помощью 
ІлЬќооЇ, отсюда и префикс 17 в имени ІТІІВВАКІЕЅ). 

Ө Чтобы образовать переменную содержания из имени файла, замените все сим- 
волы, отличные от букв, цифр изнака @, символом подчеркивания, как в случае 
11радісі. Ја ® 116аіс Ја. 

Ө Определив, как генерировать разделяемую библиотеку, мы можем использо- 
вать ее для сборки программ и тестов. 

© Переменная 7Е575 определяет, какие тесты прогонять в ответ на команду паке 
сһеск. Поскольку зачастую это скрипты оболочки, не требующие компиляции, 
эта переменная отличается от переменной сһеск РКОСВАМ5, которая определяет, 
какие программы необходимо собрать для выполнения тестирования. В нашем 
случае они совпадают, поэтому мы присваиваем одну другой. 


Добавление фрагментов такее 

Если вы провели исследовательскую работу и выяснили, что Ащотаке не может 
справиться с некоторой специфической целью, то можете вписать ее в Маћејіе.ат, 
как в обычный такеШе, — просто включите цель и связанные с ней действия: 
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багдеё: адерѕ 
ѕсгірё 


в любое место Маҝејіе.ат, и АшютаКке буквально скопирует ее в конечный 
такеЁ]е. Например, в файле Маѓејіе.ат, описанном в разделе «Ру(ћоп как вклю- 
чающий язык» на стр. 128, явно указано, как компилировать пакет на Ру Поп, по- 
тому что Ашотаке этого не знает (он умеет лишь компилировать в байт-код оди- 
ночные ру-файлы). 

Переменные, не удовлетворяющие форматам Ашотаке, также копируются бук- 
вально. Это особенно полезно в сочетании с Аиѓосопѓ, потому что если в Майе} е. 
ат имеются такие присваивания переменным: 


ТЕМР=@аџсоёетрё 
НОМІРІТҮ=ёаоёоћотё 


а в файле сопЙрите.ас есть такой код: 


# сопйдиге - обычный скрипт оболочки, а это обычные переменные оболочки 
аи офетр=40 

аџёоћит=. 8 

АС 50В57 (аџёоёетр) 

АС 50В5Т (аџёоћһит) 


то в конечном такеЁ]е появится текст вида: 


ТЕМР=40 
НОМІРІТҮ=.8 


Таким образом, мы получаем прямой канал из скрипта оболочки, формируемо- 
го Аиќосопѓ, в конечный таКеЁ]е. 


Скрипт сопЯдиге 


Скрипт оболочки сопЙрите.ас порождает два продукта: файл таке е (с помощыо 
Аиюотаке) и файл-заголовок сопйр.й. 

Если вы открывали какой-нибудь из сгенерированных к этому моменту файлов 
сопйриге.ас, то, наверное, обратили внимание, что код в нем совсем не похож на 
скрипт оболочки. Дело в том, что в нем используются многочисленные макросы 
(написанные на макроязыке т4), предопределенные в Аибосоп{ Но будьте увере- 
ны – каждый такой макрос расширяется в строки на привычном языке оболочки. 
Таким образом, сопЙвите.ас – не рецепт и не спецификация, по которой порож- 
дается скрипт оболочки сопЙвиге, это и есть сопНвиге, только сжатый с помощью 
весьма выразительных макросов. 

Синтаксис языка т4 несложен. Каждый макрос внешне напоминает функцию — 
после имени макроса в скобках записывается список аргументов, разделенных за- 
пятыми (если аргументов нет, то скобки обычно опускают). Там, где в большин- 
стве языков мы написали бы 'литеральный текст', в т4 пишут [литеральный текст], 
и чтобы избежать сюрпризов из-за того, что т4 слишком агрессивно разбирает 
входные данные, заключайте все параметры макросов в квадратные скобки. 

Хорошим примером может служить первая же строка, генерируемая Аиозсап: 
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АС_ТМТТ ( [РОБЬ-РАСКАСЕ-МАМЕ], [УЕВЗТОМ], [ВУб-ВЕРОВТ-АООВЕЗ$$]) 


Мы знаем, что этот макрос сгенерирует несколько сотен строк на языке оболоч- 
ки и где-то среди них будут установлены и интересующие нас элементы. Вместо 
строк в квадратных скобках подставьте нужные значения. Часто некоторые эле- 
менты опускаются. Например, можно написать 


АС ІМІТ((ћһе110], (1.0]) 


если вы не хотите получать извещения об ошибках от пользователей. Можно даже 
совсем не передавать аргументов, как в случае макроса АС 00ТРІТ, и тогда ставить 
скобки необязательно. 


^\ В текущей версии документации по т4 принято обозначать необязательные аргументы - 


И Ъ 


ГА 1\ да-да, я не шучу – квадратными скобками. Поэтому имейте в виду, что в написанных на п 4 
макросах для Аиїосопї квадратные скобки означают литеральный, то есть нерасширяе- 
мый, текст, а в документации по п14 – необязательный аргумент. 


Какие макросы нужны в реальном файле Ащюосоп{? Перечислим их в том по- 
рядке, в котором они встречаются. 2% 

О АС ІМТ (..), показан выше. 

О АМ ПИТ АОТОМАКЕ, чтобы АшотакКе сгенерировал таКкейіе. 

О 17 ІМТ настраивает 11Ь(ооЇ, это нужно, только если вы собираетесь устанав- 

ливать разделяемую библиотеку. 

О АС СОМЕІС ЕТІЕЅ ([Макей1е ѕџраіг/Макеї1е]) инструктирует АиосопЁ обрабо- 

тать перечисленные файлы и заменить переменные вида @сс@ соответствую- 
щими значениями. Если предполагается создать несколько файлов таке е 
(обычно в подкаталогах), их нужно перечислить здесь. 

О АС 00ТРЏТ, чтобы вывести результат. 

Итак, у нас имеется спецификация для создания пакета сборки, работающего 
в любой РОЗ[Х-совместимой системе, и занимает она четыре или пять строк, три 
из которых, вероятно, написал за вас Аиѓоѕсап. 

Но настоящее искусство, требующееся для того, чтобы получить не просто ра- 
ботающий, а интеллектуальный сопЙвите.ас, – научиться предвидеть проблемы, 
с которыми может столкнуться пользователь, и отыскать макрос Аиќосопѓ, кото- 
рый распознает проблему и, возможно, исправит ее. Один такой пример мы уже 
видели: я рекомендовал включить в сопјівиге.ас макрос АС_РВОб_СС_С99, который 
проверит наличие компилятора, отвечающего стандарту С99. Стандарт РОЅІХ 
требует, чтобы такой компилятор присутствовал и назывался с99, но из того, что 
РОЗХ что-то требует, еще не следует, что все системы подчиняются, и это как раз 
тот аспект, который должен проверять хороший скрипт сопйрите. 

Наличие необходимых библиотек – классический пример проверки предвари- 
тельных условий. Вернемся на секунду к файлам, которые генерирует Ашёосопё 
сопћів.ћ – это обычный С-заголовок, состоящий из последовательности директив 
#Чейле. Например, если Аиќосопї убедился в наличии библиотеки С$1., то в этом 
файле появится такая строка: 
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#аеѓіпе НАМЕ 11ВС51 1 


А в своем коде вы можете расставить директивы #іѓдеѓ, так чтобы программа 
правильно вела себя вне зависимости от того, есть эта библиотека или нет. 

Логика проверки, встроенная в Ацосопь не просто находит библиотеку с опре- 
деленным именем в надежде, что она будет работать. Ащюсоп{ генерирует про- 
грамму, которая не делает ничего полезного, а только вызывает какую-нибудь 
функцию из библиотеки, а затем пытается скомпоновать эту программу с библио- 
текой. Если компоновка завершается успешно, то есть уверенность, что компо- 
новщик сможет найти и использовать библиотеку. Но Аибозсап не может сам 
сгенерировать такую проверку, потому что не знает, какие функции в библиотске 
имеются. Поэтому макросу проверки передаются имя библиотеки и имя функции, 
например: 
АС СНЕСК 11В([9116-2.0], [9 Ёгее]) 
АС СНЕСК 11В([951], [951 Ьіаѕ ддетт]) 


Добавьте в соп/ідиге.ас по одной строке для каждой библиотеки, которую соби- 
раетесь использовать и наличие которой не гарантируется на 100% стандартом С. 
Из этих однострочных семян вырастут пышные плоды – фрагменты кода в скрип- 
те сопйдиге. 

Вспомните, что менеджеры пакетов разбивают библиотеки на два пакета: дво- 
ичный разделяемый объект (ѕ0-файл) и пакет для разработчиков, содержащий 
заголовки. Пользователи библиотеки могут’забыть об установке пакета с заголов- 
ками (и даже не знать о нем), поэтому проверяйте его наличие, например вот так: 
АС_СНЕСК_НЕАРЕВ ( [951/931 паеках.В], , [АС _М$б_ЕВВОВ ( 

[Не найдены файлы-заголовки С5 (производился поиск \ 
<951/951 таёгіх.һ> в пути для включаемых файлов). Если вы пользуетесь \ 


менеджером пакетов, не забудьте установить пакет \ 
11р951-ӣеуе1 помимо самого пакета 1159$1.])]) 


Обратите внимание на две запятые: у этого макроса три аргумента, (проверяе- 
мый заголовок, действие, когда найден, и действие, когда не найден), но второй из 
них мы не задаем. 

Чтоеще могло бы случиться во время компиляции? Трудно стать авторитетом 
по всем причудам всех компьютеров на свете, имея в своем распоряжении всего 
одну-две машины. Ацѓоѕсап дает ряд хороших советов, и не исключено, что при за- 
пуске аџќогесопї будут выданы дополнительные предупреждения по поводу того, 
что добавить в соп/івие.ас. Будет правильно последовать рекомендациям. Но, на 
мой взгляд, самый лучший справочный материал – длинный перечень подлинных 
выдержек из стандарта РОЗ Х, ошибок реализации и практических советов – это 
само руководство по Аибосоп. В нем перечислены дефекты, которые АиќосопЁ ис- 
правляет сам! и которые, следовательно (и слава Богу), для нас не представляют 


' Например, «Оболочка 1к5ћ в Ѕоагіѕ 10 и РОЗ[Х-оболочка в Чтих\\аге 7.1.1... непра- 
вильно расширяют заключенные в скобки переменную, если она перссекаст границу бу- 
фера размером 1024 или 4096 байтов во встроенном документе». 
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интереса, имеются рекомендации относительно написания кода, а описания не- 
которых системных капризов сопровождаются именем макроса Аиќосопѓ который 
следует включить в файл соп/івите.ас проекта, если ситуация того требует. 


Дополнительный код на языке оболочки 


Поскольку сопАгиге.ас — сжатый вариант скрипта сопЙриге, запускаемого поль- 
зователем, вы можете включить в него произвольный код на языке оболочки. Но 
прежде чем делать это, тщательно проверьте, нет ли уже макросов, которые делают 
то, что вам нужно, – так ли уникальна ваша ситуация, что раньше никто из поль- 
зователей Ацќосоо!ѕ с ней не сталкивался? 

Если нужного макроса нет в самом пакете Аибосопф, поищите в архиве макросов 
СМО АпсосопЁ. Найденные макросы можно сохранить в подкаталоге т4 катало- 
га вашего проекта, и тогда Аиќосопї сможет их найти и использовать. См. также 
[Сасоке 2010] – кладезь бесценной технической информации об Аибогоо{5. 

Пользователю можно напечатать сообщение об убпешном завершении процеду- 
ры конфигурирования, и макрос тут не нужен, потому что, кроме команды есћо, 
ничего не используется. Вот пример такого сообщения: 


Тһапк уоџ Ёог іпѕёа11іпд ${РАСКАСЕ_МАМЕ} уегѕіоп $ (РАСКАСЕ МЕКЅІОМ). 


Іпѕёа11абіоп аігесіогу ргейх: '${ргейх}'. 
Сотр11а{1оп соттапа: '5 {СС} ${СЕЬАС$} $ {СРРЕЬАС$} ' 


Мом буре 'таке; зи4о таке 1п$%а11' ёо депегаее һе ргодгат 
апа іпѕќа11 іб ёо уоџг ѕуѕёет. 


В этом сообщении встречаются переменные, определенные Ашосопё. Все они 
описаны в документации, но можно также найти определенные переменные обо- 
лочки в самом скрипте сопЙвиге. 

Более развернутый пример использования Аиёоб0015, относящийся к библиоте- 
ке на Руќћоп, см. в разделе «РуПоп как включающий язык» на стр. 128. 
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Управление версиями 


Посмотри на мир через солниезащитные очки, 
Для рабочего класса жизнь покажется куда лучше. 


— Сапр оЁ Еоиг «І Еоцпа (ас Еѕѕепсс Ваге» 


Эта глава посвящена системам управления версиями (СУВ), в которых хранятся 
мгновенные снимки различных версий проекта, существовавших в ходе его разра- 
ботки, например: этапов работы над этой книгой, вариантов написанного в муках 
любовного письма или какой-то программы. Система управления версиями дает 
нам ряд весьма важных возможностей. 

О У файловой системы появляется новое измерение – время, так что мы мо- 
жем узнать, как выглядел файл на прошлой неделе и что с тех пор измепи- 
лось. Даже если бы больше ничего не предлагалось, одна только эта возмож- 
ность позволяет мне как автору работать более уверенно. 

О Мы можем отслеживать несколько версий проекта, например мой экзем- 
пляр и экземпляр моего соавтора. И даже в пределах своего экземпляра я, 
возможно, захочу иметь версию проекта (ветвь) с экспериментальными 
функциями и хранить ее отдельно от стабильной версии, в которой не долж- 
но быть неприятных сюрпризов. 

О На сайте ћер:/ /ріһиЬ.сот хранится примерно 175 000 проектов, боль- 
шая часть которых, если судить по опубликованным в них же сведениям, 
написана на С. Существуют также серверы, где размещены репозитории 
СУВ поменьше, например СМИ $ауаппаВ. Даже если вы не собираетесь 
модифицировать код, клонирование такого репозитория – быстрый спо- 
соб скопировать программу или библиотеку на свой диск и использовать 
затем по собственному усмотрению. Когда проект готов к передаче в руки 
общественности (или до того), репозиторий можно сделать открытым и тем 
самым организовать еще один канал распространения. 

О Когда два человека имеют доступ к одному и тому же проекту и оба могут 
вносить изменения в код, возникает проблема объединения модификаций — 
и система управления версиями позволяет сделать это с минимальными 
усилиями. 

В этой главе рассматривается Сі, распределенная система управления версия- 
ми; это означает, что любая копия проекта представляет собой автономный репо- 
зиторий со своей историей. Есть и другие системы в этой категории, например 
Мегсигіа[ и Вагааг. Между функциями всех таких систем существует более-менее 
взаимно однозначное соответствие, а имевшиеся ранее значительные отличия с 
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годами сгладились, так что, прочитав эту главу, вы сможете выбрать любую систе- 
му по своему вкусу. 


Получение списка отличий с помошью д 


Самая рудиментарная форма управления версиями – использование утилит 91ЕЁ 
и раёсћ, которые определены в стандарте РОЅІХ и потому, скорее всего, установ- 
лены в вашей системе. Наверное, на вашем диске найдутся два похожих файла, 
а если нет, возьмите любой текстовый файл, измените в нем несколько строк и 
сохраните под другим именем. Затем выполните команду 


А1ЕЕ Е1.с Е2.с 


В ответ вы получите распечатку, рассчитанную скорее на машину, чем на чело- 
века, в которой перечислены отличающиеся строки. Если перенаправить вывод 
в текстовый файл командой Ч1ЕЁ Ё1.с Ғ2.с > 911$ и открыть файл 91ЕЁ5$ в редак- 
торе, то вы получите раскрашенную картинку, в которой легко ориентироваться. 
Вы увидите строки с указанием имени и местоположения файла, возможно, не- 
сколько контекстных строк, совпадающих в обоих файлах, и строки, начинаю- 
щиеся знаком + (добавленные) или – (удаленные). При запуске 41Ё{ с флагом -и 
добавленные или удаленные строки будут окружены строками неизменившегося 
контекста. 

Если есть две версии проекта \1 и \2 в разных каталогах, то, указав флаг -г (ре- 
курсивно), можно создать один файл различий в унифицированном формате ЧЁ 
для всего каталога: 


А1ЕЁЕ -иг у] у2 > а1ЕЕ-у1у2 


Команда раёсћ читает файлы различий и вносит перечисленные в нем измене- 
ния. Если у вас и у коллеги имеется версия у1 проекта, то вы можете отправить ему 
файл ді##-у172, а он выполнит команду 


раєсһ < а1ЁЁ-у1у2 


и внесет все ваши изменения в свой экземпляр версии 1. 

И даже если вы работаете в одиночестве, можете время от времени выполнять 
Ч1ЕЕ и в результате получать перечень произведенных за период изменений. Если 
в коде обнаружится ошибка, то файлы различий – первое, куда нужно смотреть, 
чтобы понять, что изменилось. Если вы уже удалили версию \1, то можете при- 
менить процедуру обратного латания к каталогу у2 — раѓсћ -К < 91Ё#-у1%2 – и тем 
самым откатиться от версии 2 к версии 1. Если текущей является версия 4, то тео- 
ретически можно обработать несколько файлов различий, чтобы вернуться во 
времени еще раньше: 
са у4 
раёсһ -В < а1ЁЁ-у3у4 


раеёсн -К < а1ЕЁ-у2у3 
раєсһ -В < а1ЁЁ-у1у2 


ПО < Часть | Окружение 


Я говорю теоретически, потому что хранить такую последовательность файлов 
различий утомительно и чревато ошибками. Система управления версиями сама 
позаботится о создании и хранении информации о различиях, или дельтах. 


Объекты СЁ 


СИ – программа, написанная на С, и, как в любой подобной программе, в ней 
есть небольшой набор объектов. Основным является объект фиксации (соттії), 
по смыслу близкий к унифицированному файлу различий. В каждом объекте 
фиксации инкапсулированы предыдущий объект фиксации и набор изменений, 
произведенных после его создания. Объект фиксации пользуется поддержкой со 
стороны индекса – списка изменений, зарегистрированных с момента создания 
последнего объекта фиксации; индекс нужен в первую очередь для генерации сле- 
дующего объекта фиксации. 

Объекты фиксации связываются друг с другом и образуют древовидную струк- 
туру. У каждого объекта фиксации есть по меньшей мере один родительский объ- 
ект. Проход вверх и вниз по дереву сродни использованию команд раїсћ и раёсћ -К 
для версий. 

Сам репозиторий формально не представлен каким-то одним объектом в исход- 
ном коде Сі, но мне удобно рассматривать его как объект, потому что типичные 
операции – создание нового, копирование и освобождение – применяются ко все- 
му репозиторию. Чтобы создать новый репозиторий в текущем рабочем каталоге, 
нужно выполнить команду: 


918 111% 


Теперь у вас имеется готовая к использованию система управления версиями. 
Возможно, вы ее не видите, потому что СЁ хранит все свои файлы в каталоге .91ї, 
а наличие точки означает, что стандартные утилиты, в частности 15, не показывают 
каталога. Но его можно увидеть с помощью команды 1$ -а или включив режим по- 
каза скрытых файлов в файловом менеджере. 

Можно вместо этого клонировать репозиторий командой дії с1опе. Именно та- 
ким образом мы получаем проект из репозитория Ѕауаппаћ или СіёһиЬ. Чтобы 
получить исходный код самой программы СЁ с помощью 91ї, нужно написать: 


ді с1опе ВЕЁрз: //9ісћор. сот/дібѕбег/дії. діб 


Возможно, вам будет интересно также клонировать репозиторий, содержащий 
примеры из этой книги: 


діс с1опе ВЕЕрз: //9ібћор. сот/Ь-К/2150-Сепеигу-Ехатр1еѕ.діс 


Если вы хотите изменить какой-то файл в репозитории -/пугеро, но опасаетесь 
что-нибудь сломать, перейдите во временный каталог (например, ткӣіг ~ /Єтр; 
са -/пр), клонируйте свой репозиторий командой 911 с1опе ~ /тугеро и эксперимен- 
тируйте сколько душе угодно. Потом можете удалить клон (ги -гї -/{пр/пугеро), на 
оригинале это никак не отразится. 
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Поскольку все сведения о репозитории хранятся в подкаталоге .91 каталога 
вашего проекта, то для освобождения репозитория нужно всего лишь выполнить 
команду: 


гт -ЕЕ .916 


Такая высокая степень автономности репозитория означает, что можно без осо- 
бых хлопот делать резервные копии и носить их с работы домой и обратно, ко- 
пировать все во временный каталог для безопасного экспериментирования и т. п. 

Мы почти готовы к созданию объектов фиксации, но поскольку в них инкапсу- 
лированы изменения, произошедшие с начального момента или с момента преды- 
дущей фиксации, то необходимо что-нибудь изменить. Индекс (в исходном коде 
СЕ структура ѕігисі іпӣех ѕѓаїќе) – это список изменений, которые будут вклю- 
чены в следующий объект фиксации. Индекс нужен для того, чтобы не регистри- 
ровать абсолютно все изменения в каталоге проекта. Например, файл дпопез.о и 
исполняемый файл дпопеѕ порождаются из дпопеѕ.с и дпопеѕ.һ. СУВ должна от- 
слеживать изменения только в дпопез.с и дпотеѕ.һ, считая, что остальные файлы 
можно в любой момент сгенерировать заново. Таким образом, основная операция 
над индексом – добавление новых элементов в список изменений. Выполните 
команду: 


ді ааа длотеѕ.с дпотез.В 


для добавления указанных файлов в индекс. Другие типичные операции измене- 
ния списка отслеживаемых файлов также должны быть зарегистрированы в ин- 
дексе: 

9і ааа пенй1е 


91Е гт о1ай1е 
9і ту Пе Ве 


Изменения, внесенные в файлы, которые уже отслеживаются СЁ, автомати- 
чески в индекс не добавляются, что, наверное, удивительно для пользователей 
других СУВ (см., однако, ниже). Добавьте их по отдельности для каждого файла 
командой 911 ада спапдедй1е или воспользуйтесь командой: 


ді ааа -и 


чтобы добавить в индекс изменения во всех уже известных Сі файлах. В какой-то 
момент накопится достаточно изменений, чтобы записать их в репозиторий в виде 
объекта фиксации. Новый объект фиксации создается командой: 


91Е соті -а -т "Это первая фиксация." 


Флаг -п присоединяет сообщение к новой ревизии, впоследствии оно будет вы- 
ведено командой 914 109. Если сообщение отсутствует, то СЁ запустит текстовый 
редактор, указанный в переменной окружения ЕІТОВ, чтобы его можно было ввес- 
ти (по умолчанию обычно подразумевается редактор уі; если вам больше нравится 
другой редактор, экспортируйте эту переменную в скрипте инициализации обо- 
лочки, например „.БазВгс или .25ћс). 
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Флаг -а говорит Сі, что я вполне мог по рассеянности не выполнить команду 
діє ада -и, поэтому хорошо бы сделать это перед фиксацией. На практике это озна- 
чает, что запускать 414 ада -џ явно не нужно, коль скоро вы всегда задаете флаг -а 
в команде 91+ сопліќ -а. 


Нетрудно найти экспертов по СИ, которые считают необходимым создавать связное пове- 
МА ствование о фиксациях. Вместо сообщения вида «добавил индексный объект, а заодно ис- 
правил несколько ошибок» такой эксперт создаст две фиксации: одну с сообщением «до- 
бавил индексный объект», а другую с сообщением «исправления ошибок». Такая степень 
контроля существует, потому что по умолчанию в индекс ничего не добавляется, так что 
автор может добавить ровно столько, чтобы описать в точности одно изменение - запись 
индекса в объект фиксации, - а затем добавить в чистый индекс новый набор элемен- 
тов для порождения следующего объекта. Мне как-то встретился блог, в котором автор 
на нескольких страницах описывал принятую им процедуру фиксации: «В самых сложных 
случаях я вывожу список различий, просматриваю его и раскрашиваю в шесть цветов...» 
Однако, пока вы не стали экспертом по СИ, такая степень контроля намного превышает 
ваши потребности. Поэтому отказ от флага -а в команде 91ї сопм1{ следует считать про- 
двинутым использованием, большинству людей не нужным. В идеальном мире флаг -а 
подразумевался бы по умолчанию, но, поскольку это не так, не забывайте про него. 


Команда 914 соплі -а добавляет новый объект фиксации в репозиторий, вклю- 
чая в него все изменения, зарегистрированные в индексе, а затем очищает индекс. 
Сохранив работу, вы теперь можете добавлять новые изменения. Более того – и 
это величайшее благо, даруемое нам системой управления версиями, – вы можете 
удалить любой код, будучи уверены, что при необходимости сможете его восстано- 
вить. Не засоряйте код большими закомментированными блоками - удаляйте их! 


` 


( ` После фиксации вы почти наверняка хлопнете себя по лбу, поняв, что кое-что забыли. Но 
./ не торопитесь создавать новую фиксацию, просто выполните команду 91 соптії --атепа 
-а, которая перезапишет последний объект фиксации. 


Дуализм дельты и мгновенного списка 


Физики иногда рассматривают свет как волну, а иногда как частицу; точно так же объ- 
ект фиксации в одних случаях лучше представлять себе как полный мгновенный снимок 
проекта, а иногда как отличие от предшественника (дельту). При любом взгляде он со- 
держит имя автора, имя объекта (как мы увидим ниже), сообщение, заданное во флаге 
-п, и (если это не самая первая фиксация) указатель на родительский объект (или объ- 
екты) фиксации. 

Что представляет собой фиксация изнутри: дельту или мгновенный снимок? Может 
быть, и то, и другое. Было время, когда СЁ всегда хранил мгновенный снимок, если 
только с помощью команды дії дс (сборка мусора) набор снимков не сжимался в набор 
дельт. Но пользователи жаловались на необходимость помнить о команде 911 дс, по- 
этому теперь она автоматически запускается после определенного числа выполненных 
команд, такчто СИ в большинстве случаев (но отнюдь не всегда) хранит дельты. 


После создания объекта фиксации ваши действия с ним сводятся в основном 
к просмотру содержимого. Чтобы увидеть дельты, хранящиеся в объекте фикса- 
ции, используется команда ді 11##, а для вывода метаданных – команда ді 109. 

Из метаданных самым главным является имя объекта, которое представляст со- 
бой непрезентабельную, но вполне разумную строку: ЅНА1-хэш, то есть 40 шест- 
надцатеричных цифр, гарантирующих, что ни у каких двух объектов не будет 
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одинакового имени и что один и тот же объект будет иметь одинаковое имя во 
всех копиях репозитория. В ходе фиксации файлов на экран выводятся несколько 
первых цифр хэша, а команда 9ії 109 позволяет получить список всех объектов 
фиксации в истории, причем каждый объект представлен своим хэшем и сообще- 
нием, заданным в момент фиксации (о прочих метаданных можно узнать, выпол- 
нив команду дії Ве]р 109). К счастью, достаточно ввести лишь часть хэша, которая 
уникально идентифицирует фиксацию. Поэтому, посмотрев на историю и решив, 
что вам нужна ревизия с номером {е9с49с44ас51504с9744е1{7248а1с5е3ЬЗЗе89, вы 
можете извлечь ее командой: 


91 сһескоое Ғе9с4 


В результате производится раскрутка дельт – то, что несколько хуже, но все же 
умеет делать раёсћ, – с откатом к состоянию проекта на момент фиксации Ёе9с4. 

В лобом объекте фиксации хранятся только указатели на родителей, поэтому 
если выполнить дії 109 после извлечения старого объекта, то мы увидим лишь 
объекты на пути к нему, а все более поздние исчезнут. Редко используемая коман- 
да 91% гейод покажет полный перечень объектов фиксации, известных репозито- 
рию, но более простой способ возврата к определенной версии проекта дает метка 
(ав) – понятное человеку имя, которое не нужно искать в истории. Метки – это 
самостоятельные объекты, хранящиеся в репозитории; в каждой метке запомина- 
ется указатель на помеченный объект фиксации. Чаще всего используется метка 
пазфег, которая ссылается на последний объект фиксации в главной ветви (по- 
скольку мы еще не говорили о ветвлении, то главная ветвь, скорее всего, является 
в вашем проекте единственной). Таким образом, чтобы вернуться назад во време- 
ни к последнему запомненному состоянию, нужно выполнить команду: 


91Е спескойЕ таѕќег 


Но обратимся снова к 91 41Ё{; эта команда показывает, какие изменения были 
произведены с момента последней зафиксированной ревизии. Ее вывод - это как 
раз то, что было бы записано в следующий объект фиксации командой 914 соптії 
-а. Как и в случае автономной утилиты 9411, команда 914 411 > 91ЕЁ5 выводит файл, 
который удобнее просматривать в текстовом редакторе с цветовой подсветкой. 

Без аргументов 91: 11## показывает различие между индексом и тем, что на- 
ходится в каталоге проекта; если вы еще ничего не добавили в индекс, то это бу- 
дут все изменения с момента последней фиксации. Если задано одно имя объекта 
фиксации, то діс 01## показывает последовательность изменений между этим объ- 
ектом и тем, что находится в каталоге проекта. Если заданы два имени, то показы- 
вается последовательность изменений от одной фиксации до другой: 
ді Ч1ЕЕ Показать различия между рабочим каталогом и индексом. 


ді А1ЕЕ 234е2а Показать различия между рабочим каталогом и заданным объектом фиксации. 
сі Ч1ЕЕ 234е2а 8Ъ90ас Показать различия между двумя объектами фиксации. 


с ~ Существует несколько соглашений об именовании, позволяющих обойтись без ввода 

`_/ шестнадцатеричных цифр. Имя НЕА относится к последней извлеченной фиксации. Обыч- 

— = но это вершина ветви, в противном случае в сообщениях об ошибке ой будет встречаться 
выражение «деїасһеа НЕА». 


14 < Часть | Окружение 


Чтобы сослаться на родителя именованной фиксации, добавьте ~1 в конец имени, чтобы 
сослаться на деда - добавьте -2 ит. д. Следовательно, допустимы такие команды: 


ді А1ЕЕ НЕАО-4 Сравнить рабочий каталог с состоянием, которое было четыре фиксации назад. 
ді снескойе мазкег-1 Извлечь предшественника головы главной ветви. 

діє сһескоџё таѕёег- Т0 же, но короче. 

ді Ч1ЕЕ Ь0897~ 68097 Посмотреть, что изменилось в фиксации Ь8097. 


Сейчас вы умеете делать следующее: 

О Сохранять инкрементные ревизии проекта. 

О Получать журналы зафиксированных ревизий. 

О Выяснять, что было недавно изменено или добавлено. 

О Извлекатьболееранние версии, если нужно откатить внесенные изменения. 

Наличие системы резервного копирования, организованной настолько, что 
можно удалять код, будучи уверенным в возможности его восстановления, само 
по себе способствует повышению вашего мастерства. 


Тайник 


Объекты фиксации — это опорные точки, от которых берут начало операции СИ. 
Например, СЕ предпочитает накладывать заплаты относительно объекта фик- 
сации, и вы можете перейти к любой фиксации, НО, выйдя ИЗ рабочего каталога, 
который не соответствует фиксации, вы уже не сможете вернуться назад. Если 
в текущем рабочем каталоге имеются незафиксированные изменения, то СЁ 
предупреждает, что вы находитесь не в точке фиксации, и обычно отказывается 
выполнять операцию. Один из способов вернуться к объекту фиксации состоит 
В ТОМ, чтобы где-то сохранить всю работу, проделанную с момента последней фик- 
сации, откатить проект к последней фиксации, выполнить операцию, а затем – за- 
кончив переход или латание - накатить сохраненные действия. 

Так мы приходим к идее тайника (збазП), специального объекта фиксации, ВО МПО- 
гом аналогичного тому, чтодает команда 91Ё соплії -а, носнесколькими дополнитель- 
ными возможностями, в частности возможностью сохранения всех не поставленных 
на учет изменений в рабочем каталоге. Вот как выглядит типичная процедура: 
ді збаѕћһ 


# Сейчас код находится в состоянии на момент последней фиксации. 
91Е сһескооё Ёе9с4 


# Походим здесь. 
діб сһескоџё таѕёег # Или влюбой другой фиксации, которая вам нужна 


# Сейчас код в состоянии на момент последней фиксации, восстановим потайные изменения: 
91Е ѕёаѕћһ рор 


Еще одна альтернатива команде 91 сһескооё извлечения ранее сохраненной 
версии в рабочий каталог – команда 91% геѕеї --вага, которая возвращает рабочий 
каталог в состояние, в котором он был на момент последней команды сһескоџї. 
Команда звучит сурово, потому что так оно и есть: вы собираетесь выбросить на 
свалку всю работу, проделанную с момента последнего извлечения. 
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Деревья и их ветви 


В репозитории существует единственное дерево, которое создается в момент, ког- 
да первый автор нового репозитория выполнил команду 9ії іпіё. Надо думать, 
вы знакомы с древовидными структурами, в которых имеется набор вершин, и 
каждая вершина связана с некоторым количеством потомков и одним родителем 
(а в экзотических деревьях типа С!говского родителей может быть несколько). 

Все объекты фиксации, кроме самого первого, имеют родителя, и в каждом объ- 
екте хранится дельта между им самим и родительским объектом. Конечный узел 
последовательности, вершина ветви, помечается именем ветви. Для наших целей 
можно считать, что имеется взаимно однозначное соответствие между вершина- 
ми ветвей и последовательностями дельт, породившими данную ветвь. Наличие 
такого соответствия означает, что мы можем рассматривать ветвь и объект фик- 
сации на ее вершине как синонимы. Таким образом, если вершиной ветви паз{ег 
является объект фиксации 234а34, то команды 91 спескойе паѕїег и 914 спескощ 
234а3А абсолютно эквивалентны (до тех пор, пока не будет записан новый объект 
фиксации, который получит метку пазѓег). Это также означает, что список объек- 
тов фиксации на ветви всегда можно восстановить, начав с объекта на вершине и 
следуя вдоль ветви назад к корню дерева. 

Обычно принято располагать полностью работоспособный код на главной вет- 
ви. Если вы хотите добавить новую функцию или провести какое-то исследова- 
ние, создайте новую ветвь. Когда эта ветвь будет отлажена, вы сможете объеди- 
нить новую функциональность с главной ветвью, а как именно, объясняется ниже. 

Существуют два способа создать новую ветвь, расщепив тем самым текущее со- 
стояние проекта: 


діє Бгапсћ пеи]1еаЁ # Создать новую ветвь... 
ді сНескойЕ пем1]еаЁ # затем извлечь только что созданную ветвь. 


# Или выполнить сразу оба шага: 
ді сһескоџё -Б пем]еаЁ 


После создания новой ветви мы можем переключаться между вершинами двух 
ветвей с помощью команд 91* сһескоџі паѕѓег и 91+ сһескоиќ пем1еаЁ. 
В какой ветви мы сейчас находимся? Легко выяснить с помощью команды 


91 Бргапсһћ 


которая выведет список всех ветвей и поставит * рядом с активной. 

Что случилось бы, если бы вы построили машину времени, вернулись в прошлое 
раньше момента своего рождения и убили своих родителей? Если верить научной 
фантастике, то при изменении истории настоящее не изменяется, зато возникает 
альтернативная история. Поэтому если вы извлечете старую версию, произведете 
в ней изменения и сохраните новый объект фиксации, содержащий эти измене- 
ния, то получите новую ветвь, отличающуюся от главной. Команда 914 ргапсћ пока- 
жет, что после такого разветвления прошлого вы оказываетесь в ветви (по Бгапсћ). 
Непомечепные ветви создают разного рода проблемы, поэтому, обнаружив, что вы 
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что-то делаете в ветви (по ргапсћ), незамедлительно выполните команду дії бгапсћ 
-п лем ргапсћ папе, чтобы поименовать только что выросшую ветвь. 


Визуальные средства 


Существует несколько графических интерфейсов, которые особенно полезны для от- 
слеживания расхождения и объединения ветвей. На основе ТК написаны программы 
91(Ки ді дџі, а команда ді іпѕѓамер запускает веб-сервер, с которым можно взаимо- 
действовать из браузера. Можете поинтересоваться у менеджера пакетов или у интер- 
нет-поисковика, какие еще есть варианты. 


Объединение 


До сих пор мы генерировали новые объекты фиксации одним из двух способов: 
создание начального объекта или применение списка дельта из индекса. Ветвь — 
это тоже последовательность дельт, поэтому, имея произвольный объект фиксации 
и список дельт из некоторой ветви, мы можем создать новый объект фиксации, 
применив этот список дельт к существующему объекту. Это и называется объеди- 
нением. Чтобы объединить все изменения, приведшие к появлению узла пен1еаѓ, 
с ветвью паз{ег, переключимся на паѕѓег и выполним команду 914 пегде: 


91Е сһескоџё таѕбег 
91Е тегде лемЈеаѓ 


Пусть, например, вы создали ветвь, отходящую от паз{ег, для разработки какой- 
то новой функциональности и вот наконец успешно прогнали все тесты; тогда при- 
менение всех дельт, лежащих на ветви разработки, к ветви пазбег должно создать 
новый объект фиксации, в котором уже присутствует новая функциональность. 

Предположим, что во время работы над новой функциональностью вы ни разу 
не извлекали ветвь паѕѓег и, стало быть, не вносили в нее никаких изменений. Тог- 
да применение последовательности дельт из другой ветви сведется просто к вос- 
произведению всех изменений, хранящихся в каждом объекте фиксации в этой 
ветви. В СЁ это называется быстрой перемоткой вперед (їаѕ-огмага). 

Но если вы вносили какие-то изменения в ветвь паѕіег, то проблема перестает 
быть такой простой и не сводится к быстрому накату всех дельт. Допустим, к при- 
меру, что в точке разветвления в файле впотез.с была такая строка: 


эпогЕ іп ћһеідһё іпсһеѕ; 


В ветви паѕќег вы удалили модификатор, сужающий тип: 


іпе Везде іпсһеѕ; 


Целью создания ветви пем]еаЁ было изменение единиц измерения: 


ѕһоге іпі Һеідһё сп; 


В этой точке Сі оказывается в безвыходном положении. Чтобы понять, как 
объединить эти две строки, нужно знать, что имел в виду человек. СЁ в этом слу- 
чае включает в текстовый файл оба варианта: 


<<<<<<< НЕАр 
116 Һеідһё іпсһезѕ; 
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эПогЕ іпе Һеідһе ст; 
>>>>>>> 3с3с3с 


Объединение откладывается до тех пор, пока вы сами не отредактируете файл, 
точно указав, что хотели сделать. В этом примере пять строк, оставленные СЁ, 
надо полагать, сведутся к одной: 


іп Һеідһе ст; 


Ниже описана процедура объединения в случае, когда быстрая перемотка не 
применима, то есть изменения имеются в обеих ветвях. 
1. Выполните команду 914 пегде оћег ргапсћ. 
2. Скорее всего, вы увидите сообщение о наличии конфликтов, требующих 
разрешения. 
3. Проверьте список необъединенных файлов с помощью команды 914 зёаёџѕ. 
4. Выберите файл для ручной правки. Откройте его в текстовом редакторе, и 
если это конфликт содержимого, то найдите маркеры конфликтов. Если же 
конфликт связан с именем или местоположением файла, переместите файл 
туда, где ему положено быть. 
5. Выполните команду 914 айй уоџг пом йхед йе. 
6. Повторяйте шаги 3—5, пока не будут устранены все конфликты. 
7. Выполните команды 91% соплі, чтобы завершить операцию объединения. 
Пусть во время этой ручной работы вас утешает мысль, что СЁ очень осторожен 
в том, что касается объединения, и ни при каких обстоятельствах не сделает авто- 
матически ничего, что могло бы привести к потере вашей работы. 
По завершении операции все изменения, внесенные в боковой ветви, представ- 
лены в окончательном объекте фиксации на ветви, указанной в качестве цели объ- 
единения, поэтому боковую ветвь обычно удаляют: 


ді 4е1еке оЁһег Бгапсһ 


Метка оќћег Бгапсћ удалена, но объекты фиксации, приведшие к ее появлению, 
по-прежнему находятся в репозитории для справки. 


Перемещение 


Допустим, в понедельник вы создали новую ветвь для тестирования. Со вторника 
по четверг вы вносили многочисленные изменения в главную и тестовую ветвь. 
В пятницу при попытке объединить тестовую ветвь с главной выявилось гигант- 
ское количество мелких конфликтов, которые предстоит разрешать. 

Отмотаем пленку назад к началу недели. В понедельник вы создали тестовую 
ветвь, а это означает, что у последних объектов фиксации в обеих ветвях имеется 
общий предок: понедельничный объект фиксации в главной ветви. Во вторник вы 
создали новый объект фиксации в главной ветви, скажем арсӣ123. В конце дня вы 
накатываете все изменения, произведенные в главной ветви, на тестовую: 


діє ргапсһ беѕќіпд # перейти на тестовую ветвь 
діє гераѕе арсӣ123 # или эквивалентно: ви геђаѕе тат 
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Команда геразе воспроизводит на тестовой ветви все изменения, произведен- 
ные в главной ветви с момента создания общего предка. Возможно, придется вруч- 
ную выполнить объединение, но это работа всего за один день – все-таки задача 
более обозримая. 

Теперь все изменения вплоть до объекта фиксации арсӣ123 присутствуют в обе- 
их ветвях, то есть ситуация такая, как будто мы разветвились на этом объекте, а не 
на понедельничном. Отсюда и название операции: тестовая ветвь перемещена и 
теперь отходит от другой точки на главной ветви. 

Перемещение производится также в конце рабочего дня в среду, четверг и пят- 
ницу, причем каждая операция сравнительно безболезненна, поскольку в тесто- 
вой ветви уже присутствуют изменения, произведенные в главной на протяжении 
предшествующих дней. 

Операция перемещения часто считается продвинутым использованием СЕ, по- 
скольку в других системах, не настолько хорошо работающих с накатом дельт, се 
нет. Но на практике перемещение и объединение равноценны: в обоих случаях из- 
менения, произведенные в другой ветви, применяются для создания объекта фик- 
сации, а разница заключается только в том, сшиваете вы концы двух ветвей (как 
в случае объединения) или хотите, чтобы они продолжали существовать раздель- 
но (как в случае перемещения). Типичное использование — переместить дельты 
с главной ветви на боковую и объединить изменения в боковой ветви с главиой, то 
есть операции в некотором смысле симметричны. Как было указано выше, накоп- 
ление изменений в обеих ветвях может затруднить окончательное объединение, 
поэтому рекомендуется выполнять перемещение достаточно часто. 


Дистанционные репозитории 


Все, о чем шла речь до сих пор, происходило в пределах одного дерева. Если вы 
клонировали репозиторий, находящийся где-то в другом месте, то сразу после 
клонирования ваш клон и оригинал имеют одинаковые деревья с идентичными 
объектами фиксации. Однако если вы и коллеги продолжаете работать, то добав- 
ляются различные объекты фиксации. 

У вашего репозитория имеется список дистанционных! репозиториев, каждый 
из которых представляет собой указатель на репозиторий, находящийся где-то на 
другой машине. Если вы получили свой репозиторий командой 91+ с1опе, то репо- 
зиторий, который вы клонировали, будет в вашем новом репозитории называться 
огідіп. В типичном случае это единственный дистанционный репозиторий, с ко- 
торым вы будете иметь дело. 

Впервые после клонирования выполнив команду 914 Бгапсй, вы увидите одну- 
единственную ветвь вне зависимости от того, сколько ветвей было в оригинале. 
Но если выполнить команду 914 бгапсћ -а, которая показывает все известные СЁ 


' Выбран этот термин, а не «удаленный репозиторий», чтобы не возникало мысли о том, 


что репозитория больше нет. – Прим. перев. 
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ветви, то вы увидите не только локальные, но и дистанционные ветви. Если вы 
клонировали репозиторий из СіћиБ и т. п., то эта команда позволит узнать, по- 
мещали ли другие авторы новые ветви в центральный репозиторий. 

Копии ветвей в локальном репозитории пребывают в том состоянии, в каком 
были на момент первоначального получения. На следующей неделе для обновле- 
ния дистанционных ветвей информацией из оригинального репозитория выпол- 
ните команду 914 Ёеѓсһ. 

Имея в своем репозитории актуальные дистанционные ветви, вы можете про- 
извести объединение, указав полное имя ветви, например 91" пегде гетобеѕ/огідіп/ 
пазфег. 

Вместо двухшаговой процедуры 91+ Ееесй; 91 пегде гепоёеѕ/огідіп/таѕёег можно 
обновить ветвь одной командой 


91 ри11 огідіп таѕќег 


которая скачивает дистанционные изменения и тут же объединяет их с текущим 
репозиторием. 

Обратная операция называется риѕћ, она позволяет записать в дистанционный 
репозиторий свою последнюю фиксацию (но не состояние индекса или рабочий 
каталог). Если вы работаете в ветви с именем БЪгапсН и хотите записать ее в дис- 
танционный репозиторий под тем же именем, выполните команду: 


91 риѕћ огідіп ББгапсв 


Скорее всего, при записывании изменений применение ваших дельт к удален- 
ной ветви не будет прямой перемоткой (это означало бы, что коллеги ничего не 
делают). Для разрешения конфликтов объединения требуется участие человека, 
но на стороне дистанционного репозитория человека, наверное, нет. Следователь- 
но, СЁ при записи в удаленный репозиторий разрешает только прямую перемотку. 
А как гарантировать, что ваша операция записи – прямая перемотка? 

1. Выполните команду 911 ру1] огідіп, чтобы получить изменения, произве- 

денные с момента последнего извлечения. 

2. Выполните объединение, как было показано раньше, - в этом случае чело- 
веком, разрешающим конфликты, будете вы. 

Выполните команду 911 соті -а -п "деа1* міїћ пегдез". 

4. Выполните команду 91# риѕћ ог191п паѕѓег; это получится, поскольку теперь 
Сі должен применить единственную дельту, что можно сделать автомати- 
чески. 

До сих пор я предполагал, что вы находитесь в локальной ветви паз*ег и пытае- 

тесь взаимодействовать с дистанционной ветвью паз*ег. Если имена другие, то ука- 
зывайте пары имен ветвей, разделенных двоеточием в формате 5оигсе: дез 1па1оп. 


сә 


ді рџ11 огідіп пем сһапдеѕ:таѕсег Объединить дистанционную пеш сһапреѕ с локальной таѕіег 

діє роѕћ огідіп ту іхеѕ:уегѕіоп 2 Объединить локальную ветвь с дистанционной, имеющей другое имя 

91Е ризН огідіп :ргипе те Удалить дистанционную ветвь 

91Е рџ11 огідіп пем сһапдеѕ: Извлечь в несуществующую ветвь; будет создан объект фиксации 
сименем ЕЕТСН_ НЕАР 
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Ни одна из этих операций не изменяет текущую ветвь, но некоторые создают 
новую, на которую можно перейти, как обычно, командой 914 спескоп{. 


Центральный репозиторий 


Несмотря на все рассуждения о децентрализации, самой простой конфигурацией для 
совместной работы по-прежнему остается центральный репозиторий, который все мо- 
гут клонировать. Это означает, что у всех авторов один и тот же оригинальный репози- 
торий. Именно так обычно работает скачивание из Оіїћир и Ѕауаппаһ. Для настройки 
репозитория на такой режим работы выполните команду дії іпіі --раге, которая гово- 
рит, что никто не вправе ничего делать в этом репозитории, а необходимо его предва- 
рительно клонировать (такой репозиторий, не имеющий рабочего каталога, называет- 
ся голым). Существуют также некоторые полезные флаги разрешений, например флаг 
--зрагед=дгоир позволяет всем членам группы (в смысле РОЅІХ) читать и записывать 
в репозиторий. 

Если дистанционный репозиторий не является голым, то вы не можете ничего записать 
в ветвь, которую извлек владелец репозитория, в противном случае воцарился бы хаос. 
Если такая необходимость возникнет, попросите коллегу сменить ветвь командой дії 
ргапсћһи, когда целевая ветвь освободится, произведите в нее запись. 

Альтернативно коллега может настроить открытый голый репозиторий и закрытый ра- 
бочий. Вы записываете свои изменения в открытый репозиторий, а коллега извлекает 
их в свой рабочий, когда ему удобно. 


Структура репозитория СЁ не особенно сложна: объекты фиксации, представ- 
ляющие изменения с момента создания родительского объекта фиксации, орга- 
низованы в виде дерева, а в индексе собираются все изменения, которые будут 
сделаны при следующей фиксации. Но эти элементы позволяют хранить несколь- 
ко версий программы, без опаски удалять файлы, создавать экспериментальные 
ветви и впоследствии, после успешного тестирования, объединять их с основной, 
а также объединять работу коллег со своей собственной. Команда дії ће1р и ин- 
тернет-поисковик расскажут вам о многих других приемах, позволяющих удобно 
организовать свою работу. 


Глава 


зсозсвосотос ооо воюосоовою%о ооо оо ооо эюо9ооооо9осоо 


Мирное 
сосушествование 


Количество языков программирования стремится к бесконечности, и у большин- 
ства из них имеется интерфейс с С. В этой коротенькой главе я дам общее пред- 
ставление о процессе и подробно продемонстрирую интерфейс с языком Ру оп. 

У каждого языка есть свои традиции организации пакетов и распространения, 
а это означает, что, написав комбинированный код на С и включающем языке, 
вы сталкиваетесь со следующей проблемой: как заставить систему сборки паке- 
тов откомпилировать и скомпоновать ваше творение. Это открывает передо мной 
возможность рассказать о более продвинутых приемах работы с Ашо{оо(5, в част- 
ности об условной обработке подкаталога и добавлении точек подключения для 
установки. 


Динамическая загрузка 


Перед тем как переходить к другим языкам, полезно будет остановиться на функ- 
циях С, благодаря которым межъязыковой интерфейс вообще возможен: йореп и 
91зут. Первая открывает динамическую библиотеку, а вторая ищет в ней символ, 
например статический объект или функцию. 

Эти функции описаны в стандарте РОЅІХ. В М№іпӣомѕ имеются аналогичные 
функции, но называются они БоаЯЬ1Ьхагу и беЕРгосАйдгеѕѕ; для простоты изложе- 
ния я ограничусь именами РОЅІХ. 

Название «разделяемый объектный файл» точно раскрывает смысл идеи: такой 
файл содержит список объектов, в том числе функций и статически определенных 
структур, предназначенных для использования в других программах. 

Использование такого файла можно уподобить поиску элемента в текстовом 
файле, содержащем список элементов. В случае текстового файла мы сначала вы- 
зываем функцию реп, которая возвращает описатель файла, а затем функцию, 
которая производит поиск в файле и возвращает указатель на найденный эле- 
мент. В случае же разделяемого объектного файла функция открытия называется 
9]ореп, а функция поиска символа - 91зум. А волшебство заключается в том, что 
можно сделать с возвращенным указателем. В случае списка мы имеем указатель 
на обычный текст и можем производить с ним стандартные операции. Имея же 
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указатель на функцию, мы можем эту функцию вызвать, а получив указатель на 
структуру, работать с ней как с уже инициализированным объектом. 

Всякий раз как ваша программа на С вызывает функцию, находящуюся в биб- 
лиотеке, именно так эта функция ищется и используется. Программа, в которой 
реализована система подключаемых модулей, делает это, чтобы загрузить функ- 
ции, написанные другими авторами уже после того, как основная программа была 
развернута пользователем. Скриптовый язык, желающий вызвать написанный на 
С код, вызывает для этой цели те же самые функции 91ореп и 415уп. 

Чтобы продемонстрировать работу с 91ореп и 41зут, в примере 5.1 приведен ру- 
диментарный интерпретатор С, который делает следующее: 
просит пользователя ввести код функции на С; 
компилирует эту функцию и создает разделяемый объектный файл; 
загружает разделяемый объектный файл с помощью 41ореп; 
получает указатель на функцию с помощью 915уп; 
исполняет функцию, которую только что ввел пользователь. 

Вот пример запуска: 


ооооо 


Я готов выполнить функцию. Но сначала вы должны ее написать. 
Введите тело функции. Оно должно оканчиваться строкой, содержащей 
единственный символ '}'. 


>>аоџр1е Ёп (аоцЬ1е іп) { 

>> геіцгп $аг® (іп) *ром (іп, 2); 
>>}. 

#(1) = 1 

Е(2) = 5.65685 

Е(10) = 316.228 


Пример 5.1 * Программа запрашивает у пользователя код функции, 
сразу компилирует его и исполняет функцию (аупатс.с) 


#Аейпе СМО Ѕ00КСЕ //чтобы 5410. включил аѕргіпёѓ 
#іпс1џае <41#сп.һ> 

#іпс1џае <51аіо.һ> 

#іпс1џае <5ѕ.а1іБ.һ> 

#1пс1и4е <геаа1іпе/геаа!іпе.һ> 


уоіа деб а Ёџпсёіол () { 
ЕТЬЕ *# = Ғореп ("Ёп.с", "м"); 
ЕргіпёЁ (Ё, "#1пс1а4е <таёһћ.һ>\п" © 
"доџЬ1е Еп(аоцЬ1е іп) {\п"); 

сһаг *а 1іпе = МОГ; 

сһаг *Неа4ег = ">>аоџЬ1е їп (аӢоџЬ1е іп) {\п>> "; 

ао { 
Ғгее (а Ііпе); 
а Ііпе = геаа11пе (һеайег); © 
Ерг1пЕЁ(Ё, "%5\п", а 1іпе); 
реа4ег = ">> "; 

} мһіІе (ѕгстр (а Ііпе, "}")); 

Ғс1оѕе (ЕЁ); 
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} 


уоіа сотрііе апа гип () { 
сһаг *гип те; 
азрг1пЕ ЕЁ (6&гоп те, "с99 -ЕРТС -ѕһагеа Ёп.с -о Ёп.ѕо"); © 
1Е (ѕуѕбет (гип те) !=0) { 
ргіпеЁ ("Ошибка компиляции."); 
геіигп; 


} 


уоіа *Папа1е = а1ореп("Ёп.50", ВТ 1А7Ү); ө 
іЁ (!Вапа1е) ргіпеё ("Ғаі1еа ќо 1оаа #п. ѕо: %\п", аІеггог()); 


КуредеЕ аоџЬ1е (* ёп буре) (дӢоџр1е); © 
Ғп буре Ё = а1ѕут(һапа1е, "Ёп"); 
ргіпіЁ ("#(1) =%9\п", #(1)); 
ргіпе# ("Е (2) =%9\п", Ё(2)); 
ргіпеЁ ("Е (10) =%а\п", #(10)); 
} 


іпЕ таіп () { 
ргіпіЁ ("Я готов выполнить функцию. Но сначала вы должны ее написать. \п" 
"Введите тело функции. Оно должно оканчиваться строкой, содержащей\п" 
"единственный символ '}\п\п"); 
деЕ_а_ЁЕапсЕ1оп (); 
сотрі1е апа гоп (); 


} 


© Эта функция сохраняет введенное пользователем определение функции, до- 
бавляя к нему заголовок математической библиотеки (чтобы были доступны 
функции ром, з1п ит. п.) и синтаксически правильное объявление. 

Ө Это интерфейс к библиотеке Кеайіпе. Мы передаем функции заголовок, она 
обеспечивает пользователя удобными средствами ввода дополнительной ин- 
формации и возвращает строку, содержащую все, что пользователь ввел. 

© Сейчас введенная пользователем функция находится в с-файле, и мы можем от- 
компилировать его. Возможно, вы захотите модифицировать эту строку, задав 
свои любимые флаги компилятора. 

Ө Открываем разделяемый объектный файл для чтения объектов. Флаг позднего 
связывания говорит, что имена функций следует разрешать только по мере не- 
обходимости. 

© Функция 01ѕуп возвращает \014 *, поэтому мы должны сообщить информацию 
о реальном типе. 


Это самый системно-зависимый пример во всей книге. Я пользуюсь библиоте- 
кой СМИ ВеаЙпе, которая в некоторых системах устанавливается по умолчанию, 
так как она позволяет безболезненно решить задачу о вводе одной строки текста 
пользователем. Для вызова компилятора я пользуюсь функцией зуз*ет, но сами 
флаги заведомо нестандартны, поэтому их, возможно, придется изменить, чтобы 
программа заработала в вашей системе. 
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Ограничения динамической загрузки 


Но, не правда ли, было бы лучше подчистить эту программу, добавить директи- 
вы #1Е9еЁ, чтобы при работе в \Лп4о\$ использовалась функция Іоад1іргагу (хотя 
Сі это уже сделала за нас – см. раздел дтоди1ез в документации по СПБ), и встро- 
ить все это в цикл «читать-выполнить-напечатать»? 

К сожалению, это невозможно при использовании 41ореп и 91зуп. Например, 
если бы я захотел вытащить из объектного кода одну строку исполняемого кода, 
чтодолжна была бы искать й1ѕуп? Локальные переменные сразу исключаются, так 
как 91зуп видит только статические переменные, объявленные в исходном коде 
глобальными на уровне файла. Так что на примере этого полуфабриката уже про- 
являются ограничения 4]ореп и 415уп. 

Даже если наш взгляд на язык С ограничивается только функциями и глобаль- 
ными переменными, все равно есть широкий спектр возможностей. Функции 
могут создавать новые объекты, а глобальной переменной может быть структура, 
содержащая список указателей на функции или их имена в виде строк, которые 
потом можно передать 415уп. 

Разумеется, вызывающая система должна знать, какие символы искать и как 
их использовать. В примере выше я постулировал, что функция имеет прототип 
доче їл (йоџр]е). Для реализации механизма подключаемых модулей автор вызы- 
вающей системы мог бы точно специфицировать, какие символы должны присут- 
ствовать в модуле и как они будут использоваться. В случае скриптового языка, 
загружающего произвольный код, автор разделяемого объектного файла должен 
был бы написать скриптовый код, который правильно вызывает объекты. 


Процесс 


При использовании функций 91ореп и 915уп нужно заботиться об удобствах поль- 
зователя: 
функции на С следует писать так, чтобы их было легко вызывать из других 


языков; 

О писать функцию-обертку, которая вызывает С-функцию из включающего 
языка; 

О обработка структур данных на С – можно ли их передавать во включающий 
язык и обратно? 

О компоновка с библиотекой на С. После того как все откомпилировано, мы 


должны гарантировать, что на этапе выполнения система будет знать, где 
искать библиотеку. | 


Писать так, чтобы можно было понять 


Ограничения функций 41ореп и 91зут предъявляют определенные требования 
к написанию С-функций, вызываемых из других языков. 

О Макросы обрабатываются препроцессором, и в окончательной разделяемой 

библиотеке от них не остается и следа. В главе 10 мы рассмотрим разно- 
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образные способы использования макросов, позволяющие упростить рабо- 
ту сфункциями в пределах самого С, так что для построения дружелюбного 
интерфейса даже не понадобится скриптовый язык. Но если нужно ском- 

. поновать библиотеку с кодом, написанным на другом языке, то о макросах 
придется забыть, и функция-обертка должна будет взять на себя те заботы, 
которые обычно возлагаются на макрос, вызывающий функцию. 

О Включающему языку необходимо сообщить, как следует использовать 
объекты, полученные от 41зуп, например переписать объявление функции 
в виде, понятном включающему языку. Это означает, что для каждого види- 
мого объекта необходима дополнительная работа со стороны включающе- 
го языка, а следовательно, желательно сводить количество интерфейсных 
функций к минимуму. В некоторых С-библиотеках (например, в №ЬХМГ, 
см. раздел «ИЬхт] ис ОВГ. на стр. 334) имеется набор функций для полного 
контроля и «простые» функции-обертки, позволяющие в типичных случаях 
обойтись одним вызовом; если в вашей библиотеке десятки функций, по- 
думайте, не стоит ли предоставить несколько таких простых интерфейсных 
функций. Лучше иметь пакет для объемлющего языка, предоставляющий 
только базовую функциональность С-библиотеки, чем пакет, который не- 
возможно сопровождать и который в конечном итоге обязательно полома- 
ется. 

О В этой ситуации объекты – отличное решение. Если свести к нескольким 
строкам содержание главы 11, где эта тема обсуждается подробно, то речь 
идет о том, чтобы в одном файле определить структуру данных и несколь- 
ко функций для работы с ней, например ѕїгисё пен, $Егисё сору, згисё_Ёгее, 
$Егисе ргіпё и т. д. У хорошо спроектированного объекта количество интер- 
фейсных функций невелико, или, по крайней мере, среди них можно вы- 
делить подмножество, достаточное для нужд включающего языка. Как по- 
казано в следующем разделе, наличие центральной структуры для хранения 
данных еще и облегчает программирование. 


Функция-обертка 


Для каждой С-функции, которую, как вы думаете, может вызвать пользователь, 
необходима функция-обертка на стороне включающего языка. У этой функции 
несколько задач. 

О Удобство клиента. Пользователи включающего языка, незнакомые с С, не 
хотят думать о вызывающей системе С. Они ожидают получить какие-то 
сведения о функциях из справки, а справочная система, скорее всего, ори- 
ентирована на функции и объекты включающего языка. Если пользователи 
привыкли, что функции являются элементами объектов, а вы не подготови- 
ли их ктакому применению в С, то можно сконфигурировать объект, какэто 
принято во включающем языке. 

О Преобразования в обе стороны. Возможно, во включающем языке целые 
числа, строки и числа с плавающей точкой представлены типами іпё, сваг* 
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и ӣоџр1е, но в большинстве случаев между типами С и включающего языка 
необходимо какое-то преобразование. На самом деле преобразование при- 
дется выполнять дважды: первый раз из типа включающего языка в тип С, 
а затем, после вызова С-функции, нужно будет преобразовать результат об- 
ратно в тип включающего языка. Пример для Ру оп будет показан ниже. 
Пользователи ожидают, что будут работать с функцией включающего языка, 
поэтому трудно обойтись без написания функции включающего языка для каж- 
дой С-функции, и таким образом количество нуждающихся в сопровождении 
функций неожиданно удваивается. Неизбежна также избыточность, потому что 
умолчания, определенные для входных параметров на стороне С, обычно прихо- 
дится еще раз определять во включающем языке, а списки аргументов, передавае- 
мых из включающего языка, как правило, нужно проверять перед использованием 
в С-функции. И восставать против этого бессмысленно: придется мириться с из- 
быточностью и перепроверять код на стороне включающего языка при каждом 
изменении интерфейса на стороне С. Так устроена жизнь. 


Контрабанда структур данных через границу 


Временно забудем обо всех языках, кроме С; рассмотрим два С-файла, 5ётисё.с и 
изегс: в первом создается структура данных в виде локальной переменной с внут- 
ренней компоновкой, а во втором она используется. 

Простейший способ сослаться на данные через границу файла – воспользовать- 
ся указателем: 5Ёгисё.с выделяет память для структуры и передает указатель на нее 
в иегс, все счастливы. Определение структуры может быть открытым, и в таком 
случае пользователь может проанализировать данные, расположенные по указа- 
телю, и при необходимости изменить их. Поскольку процедуры в файле иѕегс мо- 
дифицируют данные, на которые ведет указатель, то между данными, видимыми в 
ѕітисі.с и изегс, не возникает рассогласований. 

Наоборот, если бы ѕѓтисѓ.с передал копию данных, а функция в иѕегс внесла бы 
в нее какие-то изменения, то мы получили бы рассогласование между данными, 
видимыми в двух файлах. Если мы ожидаем, что полученные данные будут ис- 
пользованы и сразу же отброшены или трактуются как предназначенные только 
для чтения или что 5Ётисё.с больше не будет интересоваться этими данными, то 
никакой проблемы в передаче владения данными пользователю нет. 

Таким образом, данные, с которыми 5Ё7исё.с еще будет работать, нужно переда- 
вать по указателю, а для одноразовых данных можно передавать копию. 

Ночто,есливнутреннее строение структуры данных закрыто? На первый взгляд, 
функция в файле изегс получит указатель и не будет знать, что с ним делать. Од- 
нако одну вещь она все-таки сделать может: передать указатель обратно функции 
в файле 5гисё.с. И это совершенно обычная практика. Допустим, имеется объект 
связанного списка, память для которого выделена функцией создания списка (хотя 
в СІЛЬ такой нет), тогда мы можем вызвать д 115 аррепд для добавления элемен- 
тов в список, д9 115 Ёогеасћ — для применения некоей операции ко всем элементам 
списка и т. д. Нужно лишь передавать каждой такой функции указатель на список. 
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При реализации интерфейса между С и языком, который не знает, как читать 
структуры С, такая техника называется непрозрачным, или внешним, указателем. 
Поскольку псевдонимы типов ({уре4е{), объявленные в разделяемом объектном 
файле, недоступны для 41зуп, все структуры в С-коде должны быть непрозрачны 
для вызывающего языка'. Как и в случае двух с-файлов, нет никакой неясности 
относительно того, кто владеет данными, и при наличии достаточного количества 
интерфейсных функций требуемую работу все-таки удастся выполнить. Немалая 
доля включающих языков располагает явным механизмом для передачи непро- 
зрачных указателей. 

Если включающий язык не поддерживает непрозрачных указателей, то все рав- 
но возвращайте указатель. Адрес — это целое число, и представление его в таком 
виде не влечет за собой никакой двусмысленности (пример 5.2). 


Пример 5.2 * Мы можем рассматривать адрес указателя как обычное целое число. 
В самом С для этого мало причин, но для взаимодействия с включающим языком 
может оказаться необходимо (іпіріг.с) 


#ілпс1џае <56аіо.һ> 
#іпс1џае <ѕёаіпё.һ> //іпёрёг Е 


іп таіп () { 
сһаг *аѕігіпд = "Я нахожусь где-то в памяти. "; 
іпёрег Є 1осабіоп = (іперіг Є) аѕёгіпд; © 
ре1пЕ# ("%5\п", (сһаг*) 1осабіоп); ө 


} 


© Гарантируется, что тип іпірїг ё достаточно широк для хранения адреса (С99 
$7.18.1.4(1) иС11 57.20.1.4(1)). 

9 Разумеется, в результате приведения указателя к типу целого теряется вся ин- 
формация о типе, поэтому мы должны явно восстановить тип указателя. Эта 
практика чревата ошибками, поэтому применяйте ее только при работе с систе- 
мами, которые не понимают указателей. 


Что может пойти не так? Если диапазон типа целых чисел во включающем 
языке слишком узкий, то такой подход может привести к ошибке в зависимости 
от того, где в памяти находятся данные. В подобном случае лучше бы предста- 
вить указатель в виде строки, а получив строку назад, разобрать ее с помощью 
функции $14011 (преобразование строки в тип 1019 1019 іпї). Всегда можно най- 
ти выход. 

Кроме того, мы предполагаем, что указатель не переустанавливается и не осво- 
бождается с того момента, когда он впервые передан включающему языку, и до 
момента следующего запроса из включающего языка. Например, если в С-коде 


' Встречаются языки, например Јиіа или Суоп, авторы которых не ограничились меха- 
пизмом ореп и 4зут, а разработали методы описания структур С на стороне включаю- 
щего языка, раскрыв тем самым непрозрачные указатели. Людей, пошедших эти путем, 
лично я считаю героями. 
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был произведен вызов геа]10с, то включающей программе необходимо передать 
новый непрозрачный указатель. 


Компоновка 


Как мы видели, динамическая компоновка с разделяемым объектным файлом – 
проблема, решаемая функциями 91ореп и 915уп и их аналогами в УЛп4о\5. 

Но часто существует несколько уровней компоновки: что, если вашему С-коду 
требуется какая-то системная библиотека и, стало быть, компоновка на этапе вы- 
полнения (как описано в разделе «Компоновка во время выполнения» выше)? 
В мире С на этот вопрос есть простой ответ — используйте АиѓоѓооЇѕ для поис- 
ка библиотеки в стандартном пути и задавайте правильные флаги компилятора. 
Если система сборки включающего языка поддерживает АиќоѓооЇѕ, то и проблем 
при компоновке с системными библиотеками не будет. Если можно полагаться на 
наличие рК5-сопйр, то это также может решить проблему. Если же Ашёобоо( и рке- 
сопйв не подходят, то желаю вам всяческих успехов в деле надежного использова- 
ния системы установки включающего языка для правильной компоновки с вашей 
библиотекой. Похоже, среди авторов скриптовых языков еще немало таких, кто 
полагает, что компоновка одной С-библиотеки с другой – редко встречающаяся 
частная задача, которую всякий раз нужно решать вручную. 


РуФоп как включающий язык 


Далее в этой главе мы рассмотрим на примере языка Ру{Поп практическое вопло- 
щение описанных выше принципов для решения уравнения идеального газа (см. 
пример 10.12). Сама функция нас сейчас не очень интересует, а основное внима- 
ние мы уделим созданию пакета для нее. В сетевой документации по РуШФоп хва- 
тает детальной информации, но примера 5.3 достаточно для иллюстрации работы 
абстрактных шагов: регистрация функции, преобразование выходных данных из 
формата включающего языка в формат С, преобразование результатов из формата 
С в формат включающего языка. Затем мы перейдем к компоновке. 

В библиотеке идеального газа есть только одна функция – вычисление давле- 
ния по температуре, поэтому окончательный пакет будет ничуть не интерсснее 
программы, печатающей строку «Нео, Могід» на экране. Тем не менее мы сможем 
запустить интерпретатор Ру{роп и выполнить такую программу: 


Ғгот рупге Ипрогё * 
ргеззиге Ёгот ёетр (100) 


В первой строке мы загружаем все элементы из пакета рупгї в текущее простран- 
ство имен Руќћоп. Во второй строке мы вызываем из Руќћоп функцию ргеззиге_ 
Ғгот їепр, которая загружает С-функцию (ійеаї ргеѕѕше), выполняющую всю со- 
держательную работу. 

Свой рассказ мы начнем с примера 5.3, где показан С-код, в котором Руоп 
АРІ применяется для обертывания С-функции и регистрации ее как части пакета 
Ру‹ћоп, который будет собран далее. 
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Пример 5.3 < Обертка для функции уравнения идеального газа (рулдеа!.ру.с) 


#1пс1и4е <Руёћоп.һ> 
#1пс104е "../ійеа1.һ" 


ѕгасіс РуОрјесі *14еа1 ру (РуОрјесі *5$е1#, РУуОБ)есе *агдз) { 
аоцЬ1е іпёетр; 
1Е (!'РуАгд РагѕеТир1е (агдз, "а", &іпіетр)) гебигп МОШ; © 
доџр1е оцЕ = 14еа1 ргеѕзиге (.бетр=іпбептр); 
гегигп Ру Ви119\а1ие ("4", оџ?); ө 
} 


згасіс РуМесћоареѓ тесһћоа 1іѕї[] = { (3) 
{"ргеѕзиге Ёгот ёетр", ійеа1 ру, МЕТН УАВАКСЅ, 
"бе һе ргеззиге Ёгом ёһе бетрегабџге оЁ опе мо1е оЁ дипк"}, 
МОБ, МОГ, 0, МО} 

}; 


РУМОрІМІТ ЕОМС 1п1Ерупге (уоіа) { 
Ру ІпіЄМоаџ1е ("рупге", тесһоа 1іѕі); 
} 


© РуШоп передает один объект, в котором перечислены все аргументы функции, — 
аналог агду. В этой строке аргументы читаются в список С-переменных в соот- 
ветствии с заданными форматными спецификаторами (по аналогии с зсапё). 
Если бы в списке было по одному аргументу типа іоџЫе, строки и ицерег, то 
нужно было бы написать: РуАгд_РагзеТир]е (агдѕ, "451", &іпар1, &іпѕіг, кіпіпё). 

Ө Для возврата результата список типов и возвращаемых С-значений упаковыва- 
ется в один объект Руѓћоп. 

© Оставшаяся часть файла связана с регистрацией. Мы должны построить список 
методов, реализованных функциями (имя в Руёћоп, имя С-функции, соглаше- 
ние о вызове, одна строка документации). Список должен завершаться элемен- 
том (МОШ, МО, 0, №11}. Затем надо написать функцию с именем іпіїёркапапе, 
которая будет читать этот список. 


На этом примере видно, как в Ру оп преобразуются типы входных параметров 
и возвращаемых значений (в Ру{оп это делается на стороне С, а в ряде других 
случаев — на стороне включающего языка). Секция регистрации в конце файла 
также не слишком сложна. А теперь перейдем к задаче компиляции, решение ко- 
торой может потребовать изрядной изобретательности. | 


Компиляция и компоновка 


В разделе «Создание пакета с помощью Ацёо{00[5» выше мы видели, что для ге- 
нерации библиотеки с помощью АиќоѓооЇѕ необходимы две вещи: создать файл 
Майе е.ат из двух строчек и немного подправить файл соп/ісие.ас, сгенериро- 
ванный Ацбозсап. Помимо этого, в Руоп имеется собственная система сборки 
015165, поэтому мы должны настроить еще и ее, а затем модифицировать файлы 
Апсоёоо]5, так чтобы 0156 16[5 запускалась автоматически. 
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Условный подкаталог для Аиїотаке 


Я решил поместить все относящиеся к Руоп файлы в подкаталог главного ката- 
лога проекта. Если Ащосо!{ найдет средства разработки на Руоп, то я попрошу 
егозайти в этот каталог и сделать все необходимое, в противном случае этот ката- 
лог нам не понадобится. 

В примере 5.4 показан файл сопПрвите.ас, который проверяет наличие Руёћоп и 
файлов-заголовков для него и в том случае, когда все компоненты найдены, ком- 
пилирует файлы в подкаталоге ру. Первые несколько строк, как и раньше, взяты и 
файла, сгенерированного аџёозѕсап, с обычными, описанными выше добавлениями. 
В следующих строках проверяется наличие Ру(ћоп, я их скопировал из докумен- 
тации по АиќотаКе. Здесь создается переменная РУТНОМ, содержащая путь к Рућоп, 
для сопјівите.ас создаются переменные НАУЕ РУТНОМ ТВОЕ и НАТЕ РУТНОМ РАГЗЕ, а для 
такеЁе – переменная НАТЕ РҮТНОМ. 

Если Ру(ћоп или заголовки для него отсутствуют, то переменная РҮТНОМ получит 
значение :, которые мы впоследствии сможем проверить. Если все необходимое в 
наличии, то в блоке і -ћеп- мы просим Ашосоп{ сконфигурировать подкаталог 
руи текущий каталог. 


Пример 5.4 * Файл сопідиге.ас Ше для сборки Руіћоп-пакета (ру/сопіідиге.ас) 


АС_РВЕВЕО ((2.68]) 

АС ІМІТ([рупгЄ], [1], [/аеу/пи11]) 
АС _СОМЕТС_ЗВСОТВ ( [1Чеа1.с]) 

АС СОМЕІС НЕАРЕР5 ( [сопіід.ћ]) 


АМ ІМІТ АОТОМАКЕ 
АС РКОб СС С99 
ШТ ІМІТ 


АМ РАТН_РУТНОМ (,, [:]) © 
АМ СОМОТТТОМАЬ ( [НАУЕ_РУТНОМ], [ЕезЕ "ЗРУТНОМ" != 


1Е безі "$РҮТНОМ" 1= : ; ЕТеп ө 
АС СОМЕІС $0ВрІВЅ ( [ру] ) 
В 


АС_СОМЕТС_ЕТЬЕ$ ( [Макей1е ру/Макей1е]) [3] 
АС ООТРОТ 


© В этих строках проверяется наличие Руёћоп. Если он не найден, то в псремен- 
ную РУТНОМ записывается :, после чего соответственно инициализируется пере- 
менная НАУЕ РҮТНОМ. 

Ө Если переменная РУТНОМ установлена, то АщосопЁ зайдет в подкаталог ру, иначе 
проигнорирует его. 

Ө В каталоге ру находится файл Маќе/йе.ат, из которого нужно сделать таке ве, 
об этой задаче необходимо сообщить Аџќосопї. 

( ү В этой главе вы не раз встретитесь с дополнительными средствами Ащо{оо1$, в частно- 


\/” сти с показанным выше макросом АМ РАТН_РУТНОМ и целями Амотаке а11-10са] и 1п5{а11- 
ехес-һоок. По своей природе Ащо{оо“$ – это базовая система (которую я описал в главе 3) 
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с точками подключения на любой мыслимый случай. Запоминать их все нет смысла, и, 
как правило, они не выводимы из базовых принципов. Таким образом, если при работе 
с Аиїоїоо!ѕ встречается необычная ситуация, то лучше всего поискать в руководствах или 
в Интернете подходящий рецепт. 


Мы также должны уведомить Ащюотаке о наличии подкаталога, для этого пред- 
назначен еще один блок і -ћеп в примере 5.5. 


Пример 5.5 *% Файл Маке#Не.ат в корневом каталоге проекта с подкаталогом 
для РУПоп (ру/Макейе.ат) 


руехес_ТТЬТВВАВТЕ$ =] 1Брупге.1а 
1іррупге _1а_5О0ВСЕ$=14еа1.с 


50ВО1В5=. 


1Е НАУЕ_РУТНОМ © 
$08018$ += ру 
епа1 Е 


© АшосопЁ создал переменную НАҮЕ РҮТНОМ, и здесь мы ей воспользуемся. Если она 
существует, то Ащотаке добавит ру в список каталогов, которые нужно посе- 
тить, в противном случае он ограничится только текущим каталогом. 


В первых двух строчках говорится, что Г1ЛЬвоо| должна создать разделяемую 
библиотеку 11ррупгї, которая будет установлена туда, где находятся прочие испол- 
няемые файлы Ру оп; в эту библиотеку следует включить результат компиляции 
исходного файла ійеа].с. Далее указывается первый дополнительный подкаталог 
. (то есть текущий каталог). Статическую библиотеку следует строить раньше 
обертки, позволяющей обращаться к этой библиотеке из Руѓћоп, и мы добиваем- 
ся этого, поставив . в начало списка $0Вр1А5$. Далее если переменная НАУЕ РУТНОМ 
определена, то мы с помощью оператора Ащотаке += добавляем в этот список под- 
каталог ру. 

Мы настроили систему так, чтобы каталог ру обрабатывался тогда и только 
тогда, когда средства разработки Ру{топ установлены. Теперь перейдем к самому 
каталогу ру и посмотрим, как общаются между собой 0155 и Ашоюо[5. 


Юіѕїиїіѕ при поддержке Ащо{оо!$ 


Дочитав до этого места, вы, надо думать, уже освоились с процедурой компиляции 
даже сложных программ и библиотек: 
О перечислить участвующие файлы (например, с помощью переменной уойг _ 
ргодгат 500КСЕ5 в Маке/Це.ат или непосредственно в списке ођјесіз, как 
в приведенном ранее примере файла таКее); 
О задать флаги компилятора (стандартным способом в переменной СЕ1Аб$); 
О задать флаги компоновщика и дополнительные библиотеки (в переменной 
1011В5 для СМО Маке или переменной 10А00 для СМИ Аиќоѓоо!ѕ). 
Это три основных шага, и хотя у них много вариаций, принцип достаточно ясен. 
Я уже продемонстрировал, как соединить эти три части с помощью простого фай- 
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ла таке е, с помощью Ацооо[5 и даже с помощью псевдонимов оболочки. Те- 
перь посмотрим, как они взаимодействуют с 01$ |5. В примере 5.6 показан файл 
ѕеѓир.ру, управляющий созданием Руіћоп-пакета. 


Пример 5.6 * Файл ѕеїир.ру, управляющий созданием Ру{Поп-пакета (ру/ѕеїир.ру) 


Егом аіѕёобі15.соге ітрогќ ѕебир, Ехбепѕіоп 


ру _тоџ1еѕ= ['рупге' ] 


Етойџ1е = Ехбепѕіоп ('рупгё', о 
11Ьгаг1ез$= ['рупг®'], ө 
1іргагу аігѕ=['..'], 9 
зоигсез = ['14еа1.ру.с']) 
ѕебир (пате = 'рупге', © 
уегѕіоп = '1.0', 
езсг1рЕ1оп = "'ргеззиге * уо]ище = п * В * Тетрегаёџге', 
ехе тойџ1еѕ = [Етойџ1е]) 


© Исходные файлы и флаги компоновщика. В строке 11іргагіеѕ говорится, что 
компоновщику нужно указать флаг -1рупгї. 

Ө В этой строке говорится, что в состав флагов компоновщика нужно включить 
флаг -1.., чтобы компоновщик искал библиотеки в родительском каталоге. Это 
приходится задавать вручную. 

Ө Здесь перечисляются исходные файлы, как в АџќотаКе. 

Ө Здесь задаются метаданные пакета, которые нужны Руёћоп и Юіѕіибі5. 


Спецификация процесса создания пакета в системе 015665 хранится в файле 
ѕеѓир.ру, в котором среди прочего приводятся стандартные сведения о пакете: его 
имя, номер версии, однострочное описание и т. д. Именно в этом файле мы описы- 
ваем все три вышеупомянутых элемента. 

О Исходные файлы на С, содержащие обертку для включающего языка (в от- 
личие от файлов библиотеки, которыми занимается АиќоќооЇѕ), перечисля- 
ются в переменной 500гсез. 

О РуФоп понимает переменную окружения СЕТАб$. Переменные, определен- 
ные в таКеШе, не экспортируются в программы, вызываемые таке, поэтому 
в Макејіе.ат в каталоге ру (см. пример 5.7) непосредственно перед вызовом 
руѓћоп ѕеѓир.ру Би119 устанавливается переменная оболочки СЕІАС$, в кото- 
рую копируется значение переменной Аиюсоп{ @СЕТАб$8. 

О Система Ріѕіибіїѕ требует отделять библиотеки от путей к библиотекам. 
Поскольку список библиотек меняется не слишком часто, то его вполне 
можно написать вручную, как в нашем примере (не забудьте включить ста- 
тическую библиотеку, сгенерированную Ащо‘юо[ при обработке корневого 
каталога). Но вот каталоги на разных машинах различаются, потому-то мы 
и попросили Аџѓоѓоо!ѕ сгенерировать для нас переменную ГОАО. Это жизнь, 
ничего не поделаешь. 
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Я решил построить установочный пакет, так чтобы пользователь вызывал Аибо- 
(0015, а затем АиќоѓооЇѕ вызывал 01$ и15. Поэтому наш следующий шаг - как-то 
уведомить Ащюоюо[5 о том, что ему нужно вызвать 0156615. 

На самом деле это единственная обязанность Ашотаке в каталоге ру, поэтому 
МаеЙе.ат в этом каталоге только этой проблемой и занимается. В примере 5.7 
показано, что нам нужен один шаг для компиляции пакета и еще один для его 
установки, причем для каждого шага имеется отдельная цель в таке е. Для ком- 
пиляции эта цель называется а11-1оса] и вызывается, когда пользователь набирает 
паке; для установки цель называется іпѕіа11-ехес-ћоок и вызывается, когда пользо- 
ватель набирает паке іпѕіа11. 


Пример 5.7 < Настройка Амотаке для работы совместно с 015$ 
(ру/Макейе.ру.ат) 


а11-1оса]: рупгё 


рупге: 
СЕТАС5='@СЕТАС5@' рубһоп зефор.ру Ьџі1а 


іпѕса11-ехес-Пһоок: 
руЕВоп ѕеёир.ру іпѕёа11 


Теперь у Ашотаке есть все необходимое для генерации библиотеки в корневом 
каталоге, у 0156$ есть вся нужная ей информация в подкаталоге ру, и Ашотаке 
знает, в какой момент вызывать 01565. Стало быть, пользователь может ввести 
стандартную последовательность команд . /сопйдиге; паке; зи40 паке 1п5{а11, и в ре- 
зультате будет создана как С-библиотека, так и Руфоп-обертка для нее. 
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Язык 


В этой части мы подвергнем критическому анализу все, что знаем о языке С. 

У этой процедуры две стороны: понять, какие части языка не следует исполь- 
зовать, и разобраться в том новом, что появилось недавно. Некоторые новшества 
носят чисто синтаксический характер, например возможность инициализировать 
элементы структуры по имени, другие – это функции, которые написаны за нас и 
уже стали общеупотребительными, например позволяющие работать со строками 
относительно безопасно. 

Я предполагаю, что читатель знаком с основами С. Начинающим, возможно, 
стоит предварительно познакомиться с приложением А. 

Материал распределен по главам следующим образом. 

Глава 6 – руководство для тех, кого приводят в замешательство (или легкое не- 
доумение) указатели. 

В главе 7 мы расчистим место для нового строительства. Мы бегло рассмотрим 
те концепции, которые изложены в стандартных учебниках и которые, на мой 
взгляд, должны быть опровергнуты или сочтены неактуальными. 

Глава 8 — шагв другом направлении. Здесь мы уделим внимание идеям, которые 
в типичном учебнике затрагиваются лишь мимоходом или не рассматриваются 
вовсе. 

Глава 9 посвящена строкам, мы обсудим, как работать с ними без головной боли, 
связанной с выделением памяти и подсчетом символов. Функции па11ос будет 
очень одиноко, ведь вы перестанете ее вызывать. 

В главе 10 описываются новые синтаксические конструкции, которые позво- 
ляют записывать вызовы функций в соответствии со стандартом 150, передавая 
в качестве аргументов списки произвольной длины (например, зип (1, 2.2, [...] 
39, 40)) или именованные необязательные значения (например, пем регзоп (. 
пате="Јое", .аде=32, .ѕех='М')). Как и рок-н-ролл, эти синтаксические новации не 
раз вызволяли меня из трудных положений. Не знай я о них, давно уже отказался 
бы от С. 

В главе 11 мы препарируем идеи объектно-ориентированного программирова- 
ния. Это гидра о многих головах, и попытка переноса ее на С целиком стала бы 
подвигом Геракла сомнительной ценности, однако некоторые аспекты парадигмы 
легко реализуются, когда в этом возникает необходимость. 

Возможно, это прозвучит слишком хорошо, чтобы быть правдой, но иногда 
всего одна строка кода может удвоить, учетверить, а то и еще больше увеличить 
скорость работы программы. Секрет заключается в параллельных потоках, и в гла- 
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ве 12 мы рассмотрим три системы, позволяющие превратить однопоточную про- 
грамму в многопоточную. 

Рассмотрев вопрос о принципах структурирования библиотек, мы в главе 13 
воспользуемся некоторыми изних для выполнения математических расчетов, для 
взаимодействия с интернет-сервером по используемому им протоколу, для досту- 
па к базе данных и других не менее сложных задач. 
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Ваш приятель - 
указатель 


Таким, как он, 

Нравятся все эти милые песенки, 

Ему правится подпевать 

И стрелять из ружья. 

Правда, он не понимает, что все это значит. 


— М№Мігуапа «Іп Воот» 


Подобно песне о музыке или фильму о Голливуде, указатель – это данные, описы- 
вающие другие данные. Есть от чего растеряться: вдруг, ни с того ни с сего оказы- 
ваешься в странном мире, где обитают ссылки на ссылки, псевдонимы, механизмы 
управления памятью и функция па11ос. Но судьба-злодейка не совсем безжалост- 
на, она позволяет выделить из хаоса отдельные компоненты. Например, указатели 
можно использовать как псевдонимы, не думая о па110с, которая вовсе не обязана 
быть такой вездесущей, как ее часто представляют в учебниках 90-х годов. С од- 
ной стороны, синтаксис С с его бесконечными звездочками может запутать, но, 
с другой, он предлагает средства для работы в особо сложных случаях, например 
указатели на функции. 

В этой главе рассматриваются типичные ошибки и недоразумения. Если вы уже 
давно пишете на С, то использование указателей стало второй натурой, так что 
можете пропустить эту главу вообще или просмотреть ее по диагонали. Она рас- 
считана на людей (и имя им – легион), кто чувствует себя неуверенно при работе 
с указателями. 


Автоматическая, статическая и динамическая 
память 


С предлагает три основные модели управления памятью — на две больше, чем 
в большинстве языков, и на две больше, чем вам хотелось бы знать. А как бонус для 
читателя я попозже подкину еще две модели памяти (поточно-локальную в раз- 
деле «Поточно-локальная память» и проецируемую в разделе «Использование 
ттар для очень больших наборов данных»). 
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Автоматическая 


Вы объявляете переменную при первом использовании, и она автоматически 
удаляется при выходе из области видимости. Без ключевого слова з{а{1с любая 
переменная, объявленная внутри функции, является автоматической. В типичном 
языке программирования все данные автоматические. 


Статическая 


Статические переменные находятся в одном и том же месте в течение всего вре- 
мени работы программы. Размер массива фиксирован в момент создания, но зна- 
чения в нем могут изменяться (поэтому массив нельзя назвать истинно статиче- 
ским). Данные инициализируются до начала выполнения функции паіп, поэтому 
инициализировать их можно только константами, не требующими вычислений. 
Переменные, объявленные вне функций (в области видимости файла) и внутри 
функций с ключевым словом {а{1с, являются статическими. Если вы забудете 
инициализировать статическую переменную, она будет инициализирована нуля- 
ми (или значением МО). 


Динамическая 


Динамическая! память неразрывно связана с функциями па110с и ѓгее, именно 
здесь происходит большинство ошибок нарушениязащиты памяти (зе ви). Как 
раз из-за этой модели памяти Иисус прослезился?, когда программировал на С. 
Кроме того, это единственный тип памяти, позволяющий изменять размер масси- 
ва после его объявления. 

Ниже приведена сводка различий между тремя типами памяти. В следующих 
главах большая их часть станет предметом подробного обсуждения. 


Можно задавать значение 
во время инициализации 


Можно инициализировать 
неконстантным значением 


$12е0Ё позволяет получить + 
размер массива 


В оригинале употребляется слово «тапиа!» (ручная), но такая терминология непривыч- 
на для русскоязычного читателя. – Прим. перев. 

? В стаидартах С99 и С11 $6.2.4 память, полученная от функции таШос, называется 

выделенной (аПосабед), но я предпочитаю этот термин, потому чтотак нагляднее различие 

между динамической памятью и памятью, выделенной в стеке. 


3 Евангелие от Иоанна, стих 11:35. – Прим. перев. 
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| | Статическая 


Сохраняется между вызовами 
функции 
Может быть глобальной 


Динамическая | 


Автоматическая 


Размер массива можно задать 
во время выполнения 


Размер массива можно 
изменять 


| Иисус прослезился | 


Некоторые из описанных свойств – это то, что нам нужно от переменной, на- 
пример возможность изменения размера или удобство инициализации. Другие, 
например возможностьзадавать значения на этапе инициализации, – технические 
следствия внутреннего устройства системы памяти. Поэтому, если вам вдруг по- 
надобилась какое-то специальное свойство, например возможность изменения 
размера массива во время выполнения, поневоле приходится вникать в подроб- 
ности па]10с и указателей. Если бы можно было «зачеркнуть всю жизнь и сначала 
начать», то мы не стали бы неразрывно связывать три набора свойств с тремя на- 
борами технических неудобств. Но жизнь такая, какая есть. 


Стек и куча 


У любой функции есть область в памяти, кадр, где хранится информация о ней, в том 
числе адрес возврата по завершении и место для хранения всех автоматических пере- 
менных. 

Когда функция (например, паіп) вызывает другую функцию, то операции вкадре первой 
функции приостанавливаются, а для вызванной функции создается новый кадр и поме- 
щается в стек кадров. По окончании работы функции ее кадр выталкивается из стека, 
а все хранившиеся в этом кадре переменные пропадают. 

К несчастью, на размер стека наложены произвольно выбранные ограничения, поэтому 
стек гораздо меньше памяти общего назначения - в районе 2-3 мегабайтов (так зада- 
вались умолчания в Мпих на момент написания книги). Этого хватит для хранения всех 
трагедий Шекспира, так что о размещении массива из 10 000 целых можете не беспоко- 
иться. Но наборы данных бывают куда больше, а из-за ограничений на размер стека при- 
ходится подыскивать для них место где-тоеще, а это значит – прибегать к помощи па!11ос. 
Функция па110с выделяет память не в стеке, а в области, которая называется кучей. Раз- 
мер кучи может быть ограничен или не ограничен; при работе на типичном ПК вполне 
можно считать, что размер кучи примерно равен объему всей доступной памяти. 
Детали окружения и реализации обычно в стандарте не упоминаются, а стек кадров — 
это как раз деталь реализации. Однако в реализации этого аспекта всегда наблюдался 
широкий консенсус. Таким образом, описание автоматически распределяемых пере- 
менных, приведенное в стандарте С, очень напоминает поведение переменных, выде- 
ляемых и уничтожаемых в стеке кадров, а описание того, что в этом документе называ- 
ется «выделенной памятью», - ни дать ни взять поведение памяти, взятой из кучи. 


Все это касается размещения данных в памяти. Но есть еще вопрос об объявле- 
нии собственно переменных, здесь свои правила. 
1. Если переменная типа ѕЁгисї, сһаг, 11%, доџр1е или еще какого-то объявлена 
либо вне функции, либо внутри функции с ключевым словом ѕїаѓіс, то она 
статическая, в противном случае автоматическая. 
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2. При объявлении самого указателя также указывается тип памяти, скорее 
всего, автоматической или статической (см. правило 1). Но при этом указа- 
тель может указывать на данные в памяти любого типа: статический указа- 
тель – на динамические данные, автоматический указатель - на статические 
данные, – возможны любые комбинации. 

Правило 2 означает, что определить модель памяти только по наличию ключе- 
вых слов невозможно. С одной стороны, это хорошо, потому что не приходится 
иметь дело с одной нотацией для автоматических массивов и с другой - для дина- 
мических. С другой стороны, знать, в какой памяти размещены данные, все равно 
нужно, иначе можно попытаться изменить размер автоматического массива или 
забыть про освобождение памяти, занятой динамическим массивом. 

Различие между указателем на динамическую память и указателем на автома- 
тическую память позволяет ответить на вопрос, который очень часто возникает 
у начинающих изучать С: в чем разница между ілі ап_аггау[] и іпё *а_ро1пеег? 

Встретив такое объявление: 


іпе ап аггау[32]; 


программа выполняет следующие действия: 

О отводит в стеке область для размещения 32 целых; 

О объявляет переменную ап аггау как указатель; 

О связывает этот указатель с только что отведенной областью памяти. 

Эта область выделена в автоматической памяти, то есть вы не можете ни изме- 
нить ее размер, ни сохранить данные в ней после автоматического уничтожения по 
выходе из области видимости. Есть и еще одно ограничение - указатель ап аггау 
нельзя направить куда-тоеще. Поскольку переменную ап аггау нельзя «развести» 
с выделенной для нее областью для хранения 32 целых, то в книге К&К и в стан- 
дарте С говорят, что ап_аггау является массивом. 

Несмотря на указанные ограничения, ап_аггау — все же указатель на область 
в памяти, и к нему применимы обычные правила разыменования указателей (об- 
суждаются ниже). | 

Встретив же такое объявление: 


116 *а_ро1пкег; 
программа выполняет только один из вышеописанных шагов: 
О объявляет переменную ап аггау как указатель. 


Этот указатель не привязан намертво к какому-тоадресу в памяти, поэтому его 
можно перенаправить на любой другой адрес. Допустимы следующие операции: 


// динамически выделить блок памяти, направив на него указатель а роіпёег: 
а_ро1пеег = та110ос (32*$12е0Е (іпё)); 


// направить указатель на массив, объявленный выше: 
а роіпёег = ап_аггау; 


Таким образом, нотационные различия в объявлениях іпі ап аггау[] и 11% 
ха роіпіег имеют семантический эффект. Но в других ситуациях, например при 
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объявлении ќурейеѓ (скажем, для структуры) или функции, различия не столь от- 
четливы. Например, в следующем объявлении функции: 


116 Ё(іпЕ *а роіпбег, 1пЕ ап аггау[]); 


а роіпёег и ап аггау ведут себя в точности одинаково. Никакая память не выде- 
ляется, поэтому разница между указателями на динамическую и автоматическую 
память чисто теоретическая. С-функция получает копии входных аргументов, ане 
оригиналы, а копия указателя на автоматическую память не имест таких ограни- 
чений привязки, какие были у исходного массива. Так что когда речь идет об ар- 
гументах функции, разницы между массивом и указателем нет вовсе, и в стандар- 
тах С99 $6.7.5.3(7) и С11 66.7.6.3(7) сказано: «объявление параметра вида 'массив 
типа’ заменяется объявлением 'квалифицированный указатель на тип'» (квали- 
фикаторы сопзі, геѕёгісі, тоІаб11е и _Акот1с сохраняются в ходе преобразования из 
массив-типа в указатель-на-тип). В примере выше размер массива не задавался, 
но приведение к указателю производится даже в случае объявления вида іп 9 (іпі 
ап аггау[32]). 

Я выработал у себя привычку всегда использовать форму *а роіпёег в заголов- 
ках функций и в объявлениях ѓурейеѓ потому что при этом нужно принимать на 
одно решение меньше и к тому же сохраняется правило о чтении сложных объ- 
явлений справа налево (см. раздел «Форма существительное-прилагательнос»). 
© Ваша очередь. Просмотрите какую-нибудь свою программу и определитесь с класси- 

фикацией: какие данные хранятся в статической памяти, какие в автоматической, а какие 
в динамической; какие переменные являются автоматическими указателями на динами- 


ческую память, на статические значения ит. д. Если под рукой ничего нет, выполните это 
упражнение для кода из примера 6.6. 


Переменные для хранения постоянного 
СОСТОЯНИЯ 


Эта глава посвящена главным образом взаимодействиям между автоматической 
памятью, динамической памятью и указателями, а статические переменные как-то 
остались на обочине. Однако будет уместно сделать паузу и рассказать, для чего 
могут оказаться полезны статические переменные. 

У статических переменных может быть локальная область видимости. Это 
означает, что можно определить переменную, которая видна только в одной фупк- 
ции, но при выходе из этой функции сохраняет свое значение. Это очень удобно 
для реализации внутренних счетчиков или «нестираемой» области для рабочих 
данных. Поскольку статическая переменная никогда не перемещается, указатель 
на нее остается действительным и после выхода из функции. 

В примере 6.1 приведен традиционный учебный пример: последовательность 
чисел Фибоначчи. Ее первый член равен 0, второй - 1, а каждый последующий — 
сумме двух предыдущих. 
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Пример 6.1 * Последовательность чисел Фибоначчи, генерируемая конечным 
автоматом (ЯБо.с) 
#1пс1и4е <3&41о.1> 


1оп9 1Іопд 1пе йропассі () { 
зраЕ1с 1опд 1опд 11% ЙгзЕ = 0; 
зрае1с 1опд 1опд іп зесопа = 1; 
1опд 1Іопд іпё ооё = йгѕё+ѕесопа; 
ћгѕб=ѕесопа; 
зесопа=ои*; 
гебигп оц; 


іп таіп () { 
Ғог (іп 1=0; 1< 50; 1++) 
ргіпе# ("%111\п", НБопасс: ()); 


Обратите внимание на тривиальность функции паіп. Функция йропассі – это 
небольшой автомат, который работает сам по себе; па1п остается только дернуть 
функцию, и та выдаст очередное значение. Иначе говоря, эта функция представля- 
ет собой простой конечный автомат, а ключом к реализации конечных автоматов 
в С являются статические переменные. 

Как жить таким статическим конечным автоматам в мире, где любая функция 
должна быть потокобезопасной? Комитет ИСО по языку С предвидел этот вопрос 
и включил в стандарт С11 тип памяти Тћгеай 1оса]. Стоит включить его в объ- 
явление: 


зкаЕ1с Тһгеаа 1оса1 1пЕ соипеег; 


как вы получите свой счетчик в каждом потоке. Подробнее эта тема рассматрива- 
ется в разделе «Поточная локальность» на стр. 299. 


Объявление статических переменных 


Статические переменные, даже объявленные внутри функции, инициализируются на 
этапе запуска программы, до входа в паіп, поэтому их можно инициализировать только 
константным значением. 


//это ошибка: нельзя вызывать 951 уеског_а11ос() до входа в таіп() 
баіс 951 уесіог *ѕсгаісһ = 951 уеског_а11ос (20); 


Это неприятность, но она легко устраняется с помощью макроса, который вначале при- 
сваивает переменной значение 0, а содержательную инициализацию производит при 
первом использовании: 


#Аейле Ѕѓабісаӣе# (суре, маг, іпібіа1іғабіоп) \ 
ѕіабіс уре уаг = 0; \ 
1Е (!(уаг)) маг = (іпібіа1іғабіоп); 


// порядок вызова: 
Ѕбабісде (951 уесбог*, ѕсгаєсћһ, 951 уесіог а110с(20)); 


Это работает, коль скоро іпіѓіа1іғаїіоп не равно нулю (или, в случае указателей, зна- 
чению МОШ). В противном случае переменная будет инициализироваться при каждом 
обращении. Впрочем, может быть, это и хорошо. 
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Указатели без таііос 


Говоря компьютеру установи А в В, я могу иметь в виду одно из двух. 

О Скопировать значение В вА. Если я затем инкрементирую А с помощью опе- 

рации А++, то В не изменится. 

О Сделать А псевдонимом В. В этом случае операция А++ приводит также к ин- 

кременту В. 

Всякий раз, когда программа собирается установить А в В, необходимо решить, 
что вы хотите создать: копию или псевдоним. И это никакая не специфика С. 

В С мы всегда создаем копию, но если копируется адрес элемента данных, то 
копия указателя является новым псевдонимом этого элемента. Это изящная реа- 
лизация псевдонимии. 

В других языках свои обычаи: в семействе языков, производных от [18Р пре- 
обладает создание псевдонимов, адля копирования имеется специальная команда 
ѕеї; Руфоп обычно копирует скаляры, но создает псевдонимы для списков (если 
не используется команда сору или деерсору). Зная, чего ожидать, вы сможете из- 
бежать целого класса ошибок. 

В библиотеке СМУ Заепийс ГЬгагу имеются объекты для представления век- 
торов и матриц, у тех и других есть элемент да*а, представляющий собой массив 
чисел типа доче. Допустим, что с помощью {уредеЁ мы определили пару (вектор, 
матрица) и объявили массив таких пар: 
фуредеЕ $егис® { 

951 уесёог* уесіог; 


951 тагіх* таёгіх; 
} аасараіг; 


дабараіг уоџг Паѓа [100]; 


Предположим, что вы часто обращаетесь к первому элементу первой матрицы: 


уоџг даба [0] .таёгіх->ӣаќа [0] 


Если вы хорошо знаете, как увязаны между собой различные части структур, то 
понять такую запись несложно, но набирать утомительно. Давайте заведем псев- 
доним: 


доџЬ1е *е1тЕ1 = уоџг даѓа [0] .таёгіх->даѓа; 


В данном случае знак равенства означает создание псевдонима: копирует- 
ся только указатель, и если мы изменим *е1п1, то данные, упрятанные глубоко 
в уоџг Паѓа, также изменятся. 

Псевдонимы не имеют никакого отношения к па110с и потому являются приме- 
ром полезного использования указателей вне связи с управлением памятью. 

Приведем еще один пример ситуации, когда применение па110с совершенно не- 
обязательно. Пусть есть функция, которая принимает указатель: 


уоіа 1псгепепе (іп *1) { 
(*1)++; 
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Пользователи этой функции, в сознании которых указатели и па110с неразрыв- 
но связаны, могут подумать, что для передачи указателя нужно сначала динами- 
чески выделить память: 

116 *1 = па110ос ($12е0# (іпі)); // столько усилий - и все зря 
кї = 12; 
1псгепепе (1); 


Егее (1); 
Однако проще всего положиться на автоматическое выделение: 
116 1=12; 


іпсгетепё (&1); 


Ваша очередь. Выше я дал совет: всякий раз, говоря установи А в В, думайте, что вы 
хотите получить: псевдоним или копию. Возьмите какой-нибудь код (все равно, на каком 
языке) и, анализируя его строка за строкой, ответьте на вопрос, что есть что. Нет ли в этом 
коде мест, где было бы разумно заменить копию псевдонимом? 


Структуры копируются, для массивов создаются псевдонимы 


Как видно из примера 6.2, копирование содержимого структуры - операция, запи- 
сываемая одной строкой. 


Пример 6.2 + Нет, копировать структуру поэлементно необязательно 
(соруѕігисїѕ.с) 


#1пс1и4е <аѕѕегі.һ> 


сурейе# ѕёгисі { 
іп а, Ы; 
аоџр1е с, а; 
116 *еЁд; 

} дето з; 


іпё таіп () { 
депо з 91 = {.р=1, .с=2, .4=3, .ейд= (іп []) {4,5,6}}; 
дето ѕ 42 = а1; 


а1.0=14; о 
а1.с=41; 
а1.е#9[0]=7; 

аззеге (42.а==0); Ө 


аѕѕегі (12.р==1); 

аѕѕегі (42.с==2); 

аѕѕегі (42.4==3); 

аѕѕегі (42.е#9[0]==7); 
} 


© Изменим 41 и посмотрим, изменилась ли 92. 
Ө Все эти утверждения справедливы. 
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Как всегда, вы должны понимать, является ли операция присваивания копи- 
рованием данных или созданием псевдонима. И как же обстоит дело здесь? Мы 
изменили 11.р и 91.с, но 02 не изменилась, следовательно, это копирование. Но 
копия указателя по-прежнему указывает на исходные данные, поэтому изменение 
11.е#9[0] отражается и на 92 .еЁ9. Отсюда вывод: если нужно глубокое копирование, 
то есть копирование данных, на которые ведут указатели, то понадобится функция 
копирования структуры; если же прослеживать указатели не нужно, то функция 
копирования – излишество, достаточно простого знака равенства. 

Для массивов знак равенства копирует лишь псевдоним, но не сами данные. 
В примере 6.3 мы проделали тот же трюк: сделали копию, изменили оригинал и 
проверили, что стало с копией. 


Пример 6.3 *х Структуры копируются, но присваивание одного массива другому 
приводит к созданию псевдонима (сору${гис{$2.с) 


#1пс1и4е <аѕѕегі.һ> 


іп ма1п() { 
116 арс[) = {0, 1, 2}; 
116 *сору = абс; 
сору[0] = 3; 
аѕѕегі (аЪс[0]==3); о 


} 


© Утверждение справедливо: оригинал изменился вместе с копией. 


Пример 6.4 – медленное приближение к катастрофе. Это по существу две функ- 
ции, которые автоматически выделяют две области памяти: первая выделяет па- 
мять для структуры, вторая — для небольшого массива. Поскольку память автома- 
тическая, по выходе из той и другой функции выделенная память освобождастся. 

Функция, которая завершается предложением геѓигп х, возвращает значение х 
вызывающей функции (С99 & С11 $6.8.6.4(3)). Звучит просто, но это значение 
должно быть скопировано в вызывающую функцию, так как кадр вызванной функ- 
ции очень скоро будет уничтожен. Как и раньше, в случае структуры, числа и даже 
указателя вызывающая функция получает копию возвращенного значения, а вот 
в случае массива – указатель на массив, а не копию хранящихся в нем данных. 

Тут-то искрыта ловушка, потому что возвращенный указатель может указывать 
на область автоматической памяти, выделенной для данных массива, а она при 
выходе из функции уничтожается. Указатель на освобожденную область памяти 
хуже, чем бесполезен. 


Пример 6.4 * Структуру можно возвращать из функции, массив – нельзя 
(ащотет.с) 


#1пс1и4е <ѕЕаіо.һ> 


сурейе# зегисЕ ромегз { 
ЧоцЬ1е Базе, зацаге, сиђе; 
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} ромегѕ; 


ромегѕ дес ромег (дочЬ1е іп) { 
ромегѕ оџі = {.Базе = іп, 
„.зацаге = іп*іп, 
„сибе = іп*іп*іп)}; 
геіигп оиѓ; 


іпЕ *де ечеп (іп соџпё) { 
іп оо [соил]; 
Ғог (іп 1=0; 1< соцпё; 1++) 
ооё [і] = 2*1; 
гесигп ооё; // плохо 


іп таіп () { 
ромегѕ Сһгееѕ = деф ромег (3); 
іпЕ *еуепз = деб емеп (3); 


ргіпеЁ ("Еһгееѕ : %9\Е%9\—%9\п", Еһгееѕ.раѕе, һгееѕ.ѕаџаге, ёһгееѕ.сире); 


ргіпеЁ ("еуепѕ: %1\Е%і\Е%і\п", еуепѕ [0], еуепз[1], еуепз[2]); 


} 


ө, 
4 
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© Инициализация с помощью позиционных инициализаторов. Если раньше вы 


с ними не встречались, потерпите еще несколько глав. 


© Так можно. При выходе создается копия автоматической локальной перемен- 


ной, после чего оригинал уничтожается. 


© А так нельзя. Здесь массив трактуется как указатель, поэтому при выходе соз- 
дается копия указателя. Но после того как автоматически выделенная память 
будет освобождена, указатель указывает в никуда. Если ваш компилятор доста- 


точно смышленый, то он предупредит об этом. 


© В функции, из которой былавызванадеї еуеп, переменная еуепз — обычный ука- 
затель на целое, только указывает он на уже освобожденные данные. Это может 
привести к нарушению защиты памяти, печати мусора или – если повезло – 


к печати правильных значений (по чистой случайности). 


Если нужна копия массива, то создатьеес помощью одной строки кода все-таки 
можно, но придется вернуться к явным манипуляциям с памятью, как в приме- 


ре 6.5. 


Пример 6.5 + Для копирования массива нужна функция теттоуе – допотопная 


практика, но работает (теттоме.с) 


#1пс1и4е <аѕѕегі.һ> 
#іпс1џдӢе <5&г1пд.Н> //меттоуе 


11 таіп () { 
іпе абс [] = {0, 1, 2}; 
116 *сору1, сору2 [3]; 


сору1 = арс; 
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теттоуе (сору2, абс, $12еоЕ (1п{) *3); 


арс[0] = 3; 
аѕѕегі (сору1 [0]==3); 
аѕѕегі (сору2 [0]==0); 


таНос и игрища с памятью 


Теперь перейдем к прямой работе с адресами в памяти. Часто эта память выделя- 
ется динамически с помощью па] 10с. 

Самый простой способ избежать ошибок, связанных с па110с, — не пользоваться 
па11ос вовсе. Исторически (в 1980-е и 1990-е годы) па110с была необходима для 
разнообразных манипуляций со строками; в главе 9 будет подробно рассказано 
о том, как работать со строками, вообще не прибегая к па11ос. Еще па110с была нуж- 
на для работы с массивами, размер которых устанавливается во время выполне- 
ния, — довольно распространенная ситуация; но, как будет видно из раздела «За- 
дание размера массива во время выполнения» ниже, эта практика также устарела. 

Вот мой – можно сказать, исчерпывающий - перечень оставшихся причин для 
использования па11ос. 

1. Для изменения размера существующего массива необходима функция 
геа110ос, но применять ее можно только к областям памяти, первоначально 
выделенным с помощью па11ос. 

Как объяснялось выше, возвращать массив из функции нельзя. 

3. Иногда объекты должны существовать в течение длительного времени пос- 
ле выхода из создавшей их функции. Впрочем, в главе 11 приведено не- 
сколько примеров инкапсуляции управления памятью для таких объектов 
в функциях пе\/сору/#гее, так чтобы не замутнять основную логику. 

4. Автоматическая память выделяется в стеке, размер которого обычно огра- 
ничен несколькими мегабайтами (или того меньше). Поэтому большие 
участки памяти (порядка мегабайтов) следует выделять в куче, а не в сте- 
ке. Но опять же, у вас, наверное, есть функция, которая сохраняет данные 
в каком-то объекте, и называется она как-то вроде објесі пем, такчто напря- 
мую к па110с вы все равно не обращаетесь. 

5. Иногда встречаются функции, которые возвращают указатель. Например, 
в разделе «Библиотека р геа4» на стр. 307 описывается шаблон, согласно 
которому мы должны написать функцию, возвращающую \014 *. От этой 
пули мы уворачиваемся, возвращая просто МОШЬ, но бывает, что деваться не- 
куда. Отметим также, что в разделе «Возврат нескольких значений из функ- 
ции» описывается, как возвращать структуры, поэтому мы можем вернуть 
довольно сложное значение без выделения памяти и тем самым обойти еще 
одну распространенную причину использования па110с внутри функции. 

Я составил этот перечень, дабы показать, что не такой уж он и длинный — 
пункт 5 встречается редко, а пункт 4 зачастую является частным случаем пунк- 
та 3, поскольку гигантские наборы данных упаковываются в структуры, напоми- 
нающие объекты. В промышленных программах па110с изредка используется, но 


№ 


Глава 6. Ваш приятель – указатель % 147 


обычно обертывается функциями вида пем /сору/#тее, чтобы основному коду не 
приходилось заниматься деталями управления памятью. 


Виноваты звезды 


Ну хорошо, мы убедились, что указатели и выделение памяти — вещи разные, но и 
сама работа с указателями может обернуться проблемой, а все из-за этих чертовых 
звездочек. 

В обоснование имеющегося синтаксиса объявления указателей приводят сооб- 
ражение о том, что объявление и использование выглядят схоже. Имеется в виду, 
что из объявления 


за *1; 


следует, что *1 — целое, а значит, объявить о том, что *1 целое, вполне естественно 
с помощью нотации 11% *1. 

Ну и ладно, если вам такое объяснение помогает, то и замечательно. Я неуверен, 
что смог бы придумать нечто более вразумительное. 

Существует простое правило дизайна, пропагандируемое, например, в кни- 
ге «Дизайн привычных вещей»: предметы, обладающие совершенно различными 
функциями, не должны быть похожи [Могтап 2002]. В этой книге в качестве при- 
мера приводятся органы управления самолетом – одинаковые рычаги, предназна- 
ченные для совершенно разных целей. В критической ситуации это прямой путь 
к человеческой ошибке. 

Вэтом отношении синтаксис С никуда не годится, потому что *1 в объявлении 
и *1 вне объявления – две большие разницы. Например: 


116 *1 = па110ос ($12е0Е (іпё)); // правильно 
*1 = 23; // правильно 
106 *1 = 23; // ошибка 


Я выбросил из головы правило, согласно которому объявление выглядит как 
использование. А вместо него сформулировал другое, которое мне помогает: в объ- 
явлении звездочка обозначает указатель, вне объявления - значение указателя. 

Вот корректно написанный код: 


іпё і = 13; 
іп *) = &і; 
іп *К =); 


х) = 12; 


Применяя это правило, легко видеть, что инициализация во второй строке 
правильна, потому что *) находится в объявлении и потому является указателем. 
В третьей строке *К также стоит внутри объявления, поэтому присвоить ей зна- 
чение }, тоже указатель, вполне разумно. В последней строке *] находится вне 
объявления, поэтому обозначает просто целое число, которому можно присвоить 
значение 12 (и в результате 1 изменится). 

Итак, вот первый совет: помните, что *1 в строке объявления - указатель на что- 
то, а *1 в любой другой строке - то, на что указывает указатель. 
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После разговора об арифметике указателей я дам еще один совет касательно 
сбивающего с толку синтаксиса объявления указателей. 


Все, что нужно знать об арифметике указателей 


Элемент массива можно определить'с помощью смещения от начала массива. Мы 
могли бы объявить указатель доц] е *р, считать, что это и есть начало массива, а от- 
считываемые от него смещения определяют элементы массива: по адресу начала 
находится первый элемент р[0], на один шаг вперед от начала — второй элемент 
р[1] ит. д. Таким образом, зная указатель и расстояние между двумя соседними 
элементами, я имею массив. 

Можно было бы записать сумму начала и смещения прямо и непосредственно 
ввиде (р+1). Как скажет вам любой учебник, р[1] в точности эквивалентно * (р+1), 
и это объясняет, почему первый элемент массивар[0] == * (р+0). В книге К &К этому 
вопросу уделено примерно шесть страниц (2-е издание, разделы 5.4 и 5.5). 

Из теории вытекает несколько практических правил обозначения массивов и 
их элементов. 

О Объявляйте массив в виде явного указателя йоџр1е *р или в статической 

либо автоматической форме доџр1е р[100]. 

О В любом случае п-ый элемент массива записывается в виде р[п]. Не забы- 
вайте, что индекс первого элемента равен нулю, а не единице; на него можно 
сослаться особым образом: р [0] == *р. 

О Чтобы получить адрес п-го элемента (не его значение), пользуйтесь знаком 
амперсанда: &р [п]. Разумеется, для первого элемента имеем &р[0] == р. 

В примере 6.6 продемонстрированы эти правила в действии. 


Пример 6.6 * Простая арифметика указателей (агіїһтеїіс.с) 
#іпс1џае <51аіо.һ> 


106 таіп () { 
іпе еуепѕ [5] = {0, 2, 4, 6, 8}; 
ргіпі# ("Первое четное число, конечно, равно%1\п", *еуепз); ® 
іп *роѕісіуе еуепѕ = &еуепз[1]; (2, 
ргіпеЁ ("Первое положительное четное число равно%1\п", 


роѕііуе еуепѕ[0]); ө 


} 


© Запись етепз [0] в виде *еуепз. 
Ө Адрес элемента 1 сохранен в указателе. 
Ө Обычный способ обозначения первого элемента массива. 


Я познакомлю вас с одним трюком, основанным на правиле арифметики ука- 
зателей, согласно которому р+1 – это адрес следующего элемента массива (то есть 
&р[1]). Это правило, в частности, означает, что при обходе массива в цикле Ёог нет 
нужды в индексе. В примере 6.7 используется указатель, который первоначально 
направлен на голову списка, а затем пробегает весь массив благодаря выражению 
р++, пока не встретит маркера №011, обозначающего конец массива. 
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Пример 6.7 * Мы можем воспользоваться тем фактом, что р++ означает 
«перейти к указателю на следующий», и тем самым упростить запись циклов їог 
(роіпїег_агіїһгтеїіс1.с) 


#іпс10џае <ѕіаіо.һ> 


іп ма1п() { 
сһаг *1151[] = {"Нгзе", "ѕесопа", "Еһіга", №011}; 
Ғог (сһаг **р=]1150; *р != МОЦ; р++) { 
ргіпёё ("%5\п", р[0]); 
} 


Ваша очередь. Как бы вы реализовали этот пример, если бы не знали про р++? 


Рассуждения в терминах «начало плюс смещение» дает не слишком много, 
с точки зрения изящных синтаксических фокусов, зато многое проясняет в плане 
того, как работает С. Рассмотрим структуру ѕігисі. Пусть есть такое определение 
и объявление: 
фуредеЁ зе гисе { 

11а, Ы; 


аоџЬ1е с, а; 
} арса з; 


арса ѕ 1151[3]; 


Будем считать, что 115% — это начало отсчета, а 1151 [0] .Ь немного отстоит от 
него и указывает на р. Иначе говоря, если адрес 115 можно представить в виде 
целого (ѕізе Ё) &115%, тор будет расположено по адресу (ѕіге 0) 6115 + 512е0Е (іпі), 
а 1154 [2].4 – по адресу (512е +) 61150 + 6*512е0# (іпї) + 5*512е0Е (оџр1е). При таком 
подходе структура больше напоминает массив с тем отличием, что элементам со- 
поставляются имена, а не числовые индексы, и размеры и типы элементов раз- 
личныЫ. 

Это не вполне точно из-за выравнивания: система может решить, что данные 
следует хранить в блоках определенного размера и после некоторых полей долж- 
но быть оставлено пустое место, чтобы следующие поля начиналось на границе 
машинного слова или более крупного элемента. Поэтому структура может быть 
дополнена незначащими байтами в конце, чтобы список структур был правильно 
выровнен [С99 и С11 $6.7.2.1(15) и (17)]. В заголовке 54ае/.й определен макрос 
оЁҒѕеїоғ, который восстанавливает правильность рассуждений в терминах «на- 
чало плюс смещение»: поле 115 [2]. в действительности расположено по адресу 
(ѕіле Е) 61156 + 2*512е0Е (арса 5) + оЁЁѕеёої (арса $, 9). 

Кстати, дополнение в начале структуры запрещено, поэтому 1151 [2] .а находит- 
ся по адресу ($12е_() &1ізї+ 2*5і2еоЁ (арса $). 

Ниже приведена дурацкая функция, которая рекурсивно подсчитывает коли- 
чество элементов в списке, пока не встретит нулевой элемент. Предположим (от- 
мечу, что это плохая идея), что мы хотели бы воспользоваться этой функцией для 
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любого списка, в котором нулевое значение имеет смысл, поэтому она будет при- 
нимать указатель на \014. 


11 Е(уо1а *іп) { 
іЁ (* (сһаг*)іп==0) гевогп 1; 
е1ѕе гебигп 1 + #(&(1п[1])); // Это работать не будет. 


Правило «начало плюс смещение» объясняет, почему эта функция не работает. 
Чтобы обратиться к элементу а 1151 [1], компилятор должен точно знать длину 
а 11 [0], иначе как понять, насколько смещаться от начала? Но, не видя реально- 
готипа, он не может вычислить этот размер. 


Многомерные массивы 


Один из способов реализовать многомерный массив – создать массив массивов, на- 
пример іп ап аггау[2) [3] [7]. Между этим типом и типом іпі апоёћег агау [2] [3] [6] есть 
тонкие различия, и на практике это создает больше проблем, чем ре шает, особенно при 
написании функций, которые должны работать и с тем, и с другим типом. В учебниках 
обычно предпочитают рассматривать массивы заведомо фиксированного размера (мы 
можем ожидать, что в году всегда двенадцать месяцев) или вообще не передавать мас- 
сив массивов функции. 

Послушайтесь меня - забудьте об этом. Учитывать в программах тонкие особенности 

таких типов – сплошная головная боль. У каждого свои представления о кодировании, 

но мне такая форма, кромекакв учебниках, почти никогда не встречалась. Гораздо чаще 
используют представление «начало-размерность-смещение». 

Более практичный способ реализовать многомерный массив М, х №, х М. элементов типа 

ӣоџр1е выглядит так: 

® Определить структуру, содержащую один указатель на данные (назовем его дака) и 
список размерностей. 

• Определить процедуру выделения памяти, которая инициализирует указатель да{а=п 
а110с ($12е0# (доџр1е) *№1*№2*№3) и запоминает размерности 51=М1, 52=№, $3=№3. Еще нам 
понадобится процедура, которая освобождает выделенную память. 

• Определить процедуры де! и ѕеї: деї (х, у, 2) получает значение дака [х + 51*у + 51*52*2], 
а ѕеё присваивает значение элементу в той же позиции. При таких процедурах деї и 
ѕеї в первом блоке Паѓа из 51 элементов будут находиться элементы вида (х, 0, 0). 
В следующем блоке от 51+0 до 51+51 находятся элементы вида (х, 1, 0). Строя так 
одну строку за другой, мы охватим все элементы вида (х, у, 0), для чего понадобится 
51*52 ячеек. Следующая ячейка будет находиться в позиции (0, 0, 1) ит. д., пока не 
будут исчерпаны все 51*52*53 ячеек. 

Мы можем проверить, не выходят ли параметры, переданные процедурам де! и ѕеї, за 

пределы допустимого диапазона, поскольку запомнили размерности. Значение 53 ни- 

когда не используется для доступа к позициям в сетке данных, но запомнить его тем не 
менее полезно для проверки выхода за границу. 

В библиотеке СМИ З‹еп с Ыбгагу есть хорошая реализация этой идеи для двумерных мас- 

сивов. Она несколько отличается, так как включает величину первой размерности и маркер 

смещения. Не составляет никакого труда получать подмножества двумерного массива, 
например векторы строки или столбца или подматрицы, – нужно только изменить начало 

и размерности. Для массивов размерности 3 и выше поиск в Интернете даст несколько 

реализаций описанной здесь системы «начало плюс размерность плюс смещение». 


Туреде{! как педагогический инструмент 


Всякий раз конструируя сложный тип, который зачастую включает такие вещи, 
как указатель на указатель на указатель, спросите себя, не станет ли задача яснее, 
если воспользоваться псевдонимом типа {уре4е#. 


©, 
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Например, такое популярное определение: 


фуред4её сһаг* ѕігіпд; 


позволяет визуально упростить объявление массива строк и прояснить его назна- 
чение. Если вернуться к примеру с р++ в арифметике указателей, можете ли вы 
положа руку на сердце сказать, что сћаг *1151[] – вне всякого сомнения, массив 
строк, а *р – строка? В примере 6.8 цикл ѓог из примера 6.7 переписан с заменой 
сћаг * на ѕЁгіпд. 


Пример 6.8 * Добавление {уреде{ делает громоздкий код чуть более понятным 
(роіпќег агіїһгпеїіс2.с) 


#іпс1џае <5Еаіо.һ> 
бурейе# сһаг* ѕёгіпд; 


іп ма1п() { 
ЗЕг1па 1156[] = {"Ягзе", "ѕесопа", "Еһіга", №011}; 
Еог (ѕгіпд *р=1150; *р != МОШ; р++) { 
ргіпеё ("%5\п", *р); 


} 


Строка объявления 115+ теперь читается совсем просто, и из нее совершенно 
ясно, что это список строк, а объявление зїгіпо *р говорит, что р — указатель на 
строку, то есть *р – строка. 

Впрочем, помнить, что ѕЁгіпд — это указатель на сћаг, все равно нужно, напри- 
мер для того, чтобы убедиться, что МШ — допустимое значение. 

Можнобыло бы пойтиеще дальше, например объявить двумерный массив строк, 
дополнив вышеприведенный уреде таким: буредеї ѕігіпд11ѕї ѕёгіпд*. Иногда это 
помогает, иногда только перегружает вашу собственную память. 

Псевдонимы типов очень хороши для работы с указателями на функции. Если 
имеется такой заголовок функции: 


аоџЬ1е а Ёп (іпё, іпё); // обьявление 


то для описания указателя на функцию подобного типа нужно только добавить 
звездочку (и скобки для учета приоритета операторов): 


доџріе (*а Ёп буре) (11%, іпё); // тип: указатель на функцию 

Затем поместим в начало {уреде! и тем самым определим НОВЫЙ псевдоним типа: 
Сурейе# аоџрІе (*а Ёп буре) (116, іпё); //1уреде/ для указателя на функцию 

Теперь этот тип можно использовать, как любой другой, например в объявле- 
нии функции, принимающей другую функцию в качестве аргумента: 


дӢоџр1е арр1у а Ёп (а Ёп буре Ё, іпе йгѕе іп, ілі ѕесопа іп) { 
гебигп Ё(Ёгѕ іп, ѕесопа іп); 


} 


Умение определять типы указателей на функции превращает создание функ- 
ций, принимающих другие функции, из изнурительного экзамена на правильную 
расстановку звездочек в тривиальное занятие. 
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Если разобраться, то работа с указателями может оказаться гораздо проще, чем 
пытаются представить в учебниках, потому что на самом деле это просто адрес 
или псевдоним, а вовсе не какой-то специальный способ управления памятью. 
Сложные конструкции типа указателя на указатель на строку, конечно, приводят 
в замешательство, поскольку наши предки – охотники и собиратели - не вырабо- 
тали навыков для работы с ними. Но благодаря псевдонимам типов С хотя бы дает 
средства для их приручения. 


Глава 


хоз оао оо ооо сфво`воо ооо вос осо о эсесовоос 


Несушественные 
особенности синтаксиса С, 
которым в учебниках 
уделяется чрезмерно 
много внимания 


Верю я, что это славие, 
Так давай его спалим. 


— Рогпо Гог Ругоѕ 
«Рогпо Ёог Ругоѕ» 


С – быть может, сравнительно простой язык, но его стандарт занимает примерно 
700 страниц, поэтому если вы не собираетесь посвятить его изучению всю свою 
жизнь, важно знать, какие разделы можно без опаски игнорировать. 

Начнем с диграфов и триграфов. Если на клавиатуре нет клавиш { и }, то мож- 
но использовать вместо них комбинации символов <% и%> (например, ілі па1п() 
<% ..%>). Это имело значение в 1990-х годах, когда изготавливались клавиатуры 
самых разных типов, но сегодня надо еще постараться, чтобы найти клавиатуру 
без фигурных скобок. Триграфы вида ??< или ??>, описанные в стандартах С99 и 
С11 65.2.1.1(1), настолько бесполезны, что авторы сс и сіапе даже не стали реа- 
лизовывать их разбор. 

Такие темные закоулки языка, как триграфы, игнорировать легко, потому что 
про них никто и не упоминает. Но другим частям языка в учебниках прошлых 
лет уделено немало внимания, так как они призваны удовлетворить требования 
стандарта С89 или преодолевать ограничения оборудования ХХ века. Но огра- 
ничения снимаются, и код становится проще. Если вы получаете удовольствие 
от выбрасывания лишнего кода и устранения зависимостей, то эта глава для вас. 
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Ни к чему явно возврашать значение из тап 


Для разогрева давайте-ка сократим все написанные нами программы наоднустро- 
ку. 

В любой программе должна быть функция паіп, возвращающая значение типа 
116, поэтому строка вида 


116 ма1п(){... } 


является неотъемлемым атрибутом программы. 

Наверное, вы полагаете, что разтак, то обязательно должнобытьи предложение 
геѓџгп, в котором указано то самое целое число, которое возвращает паіп. Однако 
стандарт С гласит: «..если выполнение программы доходит до закрывающей скоб- 
ки }, которая завершает функцию тат, то возвращается значение 0» (С99 и С11 
$5.1.2.2(3)). Иначе говоря, если не написать ге{игп 0; в последней строке паіп, то 
это будет подразумеваться по умолчанию. 

Напомним, что после завершения программы возвращенное ей значение можно 
увидеть с помощью команды есћо $2; воспользуйтесь этим, чтобы убедиться, что по 
достижении конца па1п действительно возвращается 0. 

Выше я уже приводил такой вариант йе/о.с, и теперь вы понимаете, как мне 
удалось свести паіп к одной директиве #1пс114е и одной строке кода': 


#іпс1џае <ѕёаіо.һ> 
116 таіп() { ргіпё# ("Не110, мог1а.\п"); } 


``] Ваша очередь. Просмотрите свои программы и удалите предложение ге{игп 0 в конце 
[ паіп. Изменилось ли что-нибудь? 


Пусть объявления текут своболно 


Вспомните, когда вы в последний раз читали пьесу. В начале текста перечисля- 
ются «действующие лица». Список имен персонажей, наверное, мало что значил 
для вас, пока вы не начали читать; я, например, всегда пропускаю его и перехожу 
прямо к началу пьесы. Если, запутавшись в сюжете, вы забудете, кто такой Бенво- 
лио, то можно будет вернуться в начало и прочитать строчку, где о нем говорится 
(друг Ромео, племянник лорда Монтекки). Но это только потому, что вы читаете 
бумажное издание. А если текст отображается на экране, то можно было бы поис- 
кать первое вхождение строки «Бенволио». 


' Кстати говоря, в этом фрагменте демонстрируется еще один способ нажимать па кла- 


виши меньше, чем того требует старый стандарт. Во втором издании К&К объявления 
вида іп таіп(), в которых не было ничего, кроме скобок, были названы «старым сти- 
лем». Такое объявление означало, что о параметрах нет вообще никакой информации, 
а не информацию о том, что функция не принимает параметров. По старым правилам 
последнее утверждение нужно было выражать в виде шё таіп(уоід), а не іпі та!п(). Но, 
начиная с 1999 года, действует правило: «Пустой список в объявителе функции, являю- 
щийся частью определения этой функции, означает, что уфункции нет параметров» (С99 
$6.7.5.3(14) и С11 $6.7.6.3(14)). 
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Короче говоря, список действующих лиц не очень полезен читателю. Было бы 
лучше знакомиться с персонажами по мере их появления. 
Мне довольно часто встречается примерно такой код: 


#1пс104е <56аіо.һ> 


іп таіп() { 
сһаг *Веаа; 
їпЕ 1; 
аоор1е гаёіо, епот; 


аепот=7; 
реа = "Это цикл для деления чисел на семь."; 
ргіпеЁ ("%5\п", ћеаа); 
Ғог (1=1; 1<= 6; 1++) { 
габіо = і/аепот; 
ргіпе# ("%9\п", габіо); 
} 


В нем три или четыре строки вводного материала (решайте сами, считать ли 
пустую строку), за которым следует собственно логика. 

Это отголоски стандарта АМЗТ С89, в котором требовалось, чтобы все объяв- 
ления находились в начале блока из-за технических ограничений ранних компи- 
ляторов. Мы по-прежнему должны объявлять переменные, но можем облегчить 
возлагаемое на автора и читателя бремя, разрешив делать это при первом исполь- 
зовании. 


#1пс1и4е <ѕЁаіо.һ> 


іп таіп() { 
ЧочЬ]е епот = 7; 
сһаг *һеаа = "Это цикл для деления чисел на семь. "; 


ргіпёё ("%5\п", ћеаа); 

Ғог (іп 1=1; і<= 6; 1++) { 
аоџЬ1е габіо = 1/4епоп; 
ргіпеЁ ("%9\п", габіо); 


Здесь объявления встречаются там, где необходимо, поэтому тяжесть бремени 
сводится к указанию имени типа при первом использовании переменной. Если 
ваш редактор поддерживает цветовую подсветку синтаксиса, то объявления по- 
прежнему легконайти (аесли не поддерживает, то вы много теряете – и ведь таких 
редакторов десятки, есть из чего выбрать!). 

Когда я читаю незнакомый код и вижу какую-то переменную, то мое первое по- 
буждение – вернуться и посмотреть, где она объявлена. Если переменная объявля- 
ется при первом использовании или в строке, непосредственно предшествующей 
первому использованию, то я сэкономлю несколько секунд. Кроме того, следуя 
правилу о том, что область видимости переменных должна быть как можно уже, 
мы существенно уменьшим количество активных переменных, объявленных в 
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предыдущих строках, а когда функция длинная, это может иметь значение. И по- 
следнее – если переменные объявлены непосредственно в цикле, то цикл легче 
поддается распараллеливанию в ОрепМР (см. главу 12). 

В данном случае объявления находятся в начале соответствующего блока, а за 
ними идут строки, не являющиеся объявлениями. Но это просто особенность 
конкретного примера, а вообще-то объявления и не-объявления могут следовать 
в произвольном порядке. 

Я оставил объявление переменной йепоп в начале функции, но можно было бы 
иего перенести внутрь цикла, потому что только в цикле она и используется. Мы 
можем доверять компилятору – он не будет тратить временя и ресурсы на соз- 
дание и уничтожение переменной на каждой итерации цикла (хотя теоретически 
именно это он и делает – см. С99 и С11 56.8(3)). Что касается индекса, то он нужен 
лишь для управления циклом, так что естественно сократить его область видимо- 
сти до этого цикла. 


Не замедлит ли новый синтаксис работу программы? 


Нет. 

На первом шаге компиляции код преобразуется во внутреннее языково-независимое 
представление. Именно по этой причине компиляторы из набора дсс (СМУ Сотрйег Со!- 
Іесїоп) способны генерировать совместимые объектные файлы для языков С, С++, АВА 
и РОВТВАМ - по завершении шага синтаксического анализа все они выглядят одинаково. 
Таким образом, грамматические удобства, включенные в стандарт С99 с целью сделать 
код понятнее человеку, к моменту порождения исполняемого файла уже не видны. 

Да и устройство, на котором выполняется программа, не видит ничего, кроме машин- 
ных команд, ему безразлично, какому стандарту соответствовал исходный код: С89, 
С99 или С11. 


Устанавливайте размер массива на этапе выполнения 

В том же ключе, что и помещение объявлений в наиболее подходящее место, 
следует рассматривать и задание длины массива во время выполнения - на основе 
вычислений, выполненных до его объявления. 

Так было не всегда: четверть века назад нужно было либо задавать размер мас- 
сива на этапе компиляции, либо использовать па11ос'. 


' Встандарте С99 требуется, чтобы совместимый компилятор поддерживал массивы перемен- 
ной длины (уапа е-епёВ аггау – УГА). Стандарт С11 сделал шаг назад и объявил такую 
поддержку факультативной. Лично мне такое поведение комитета по стандартизации кажет- 
ся неподобающим, потому что обычно комитет делает все возможнос для того, чтобы сущест- 
вующий код (даже триграфы!) можно было без ошибок откомпилировать и в будущем. 
Коль скоро массивы переменной длины – факультативная часть стандарта, уместно по- 
интересоваться, насколько они надежны. Авторы компиляторов в борьбс за рынок стре- 
мятся к тому, чтобы их компилятор справлялся с как можно большим количеством су- 
ществующих программ, поэтому неудивительно, что все крупные игроки на этом рынкс, 
всерьез претендующие на совместимость с С11, поддерживают УТА. Дажессли вы пишс- 
те код для микроконтроллера Аг4шпо (который не является традиционной системой со 
стеком и кучей) с помощью компилятора АУК-есс, он все равно может работать с МГА. 
Я считаю, что код, в котором используются массивы переменной длины, падежси па до- 
статочно широком множестве платформ, а в будущем их число будет только расти. 
Читатели, желающие, чтобы их код был совместим с компилятором, не поддерживающим 
УТА, а во всем остальном стандартным, могут воспользоваться макросом проверки воз- 
можностей (см. раздел «Макросы проверки» ниже). 
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В качестве реального примера, с которым я однажды столкнулся, рассмотрим 
создание множества потоков, причем их количество пользователь задает в виде 
аргумента командной строки. Автор решил эту задачу, получая размер массива 
в виде выражения аѓоі (агду[1]) (то есть первый аргумент из командной строки 
преобразуется в целое число), а затем выделяя память для массива такого размера. 
реһгеаа ё *Єһгеадѕ; 
іпё Єһгеаа соџпё; 


Єһгеаа соџпё = абоі (агду[1]); 
Єһгеааѕ = та11ос (Єһгеаа сооп * ѕігеої (ріћгеаа і)); 


Егее (ёһгеааѕ); 


Но то же самое можно сделать проще и короче: 


іпё Еһгеаа сооп = або1 (арду ([1]); 
реһгеаа ё Єһгеааѕ (Єћһгеаа соџпё]; 


Получается меньше мест, где можно допустить ошибку, и читается такой код 
как объявление массива, а не как инициализация машинных регистров. Динами- 
чески выделенный массив нужно впоследствии освобождать с помощью функции 
Ғтее, а автоматический можно просто бросить на пол в полной уверенности, что 
его уберут, когда программа выйдет из текущей области видимости. 


Меньше приведений 


В 1970-1980-е годы функция па110с возвращала указатель типа сһаг*, который 
нужнобыло приводить к требуемому типу (если только не выделялась память для 
строки) следующим образом: 


// забудьте об этой избыточности 
аӢоџор1е* 115 = (доџріе*) та110с(11іѕі Іепдёћ * ѕігео# (доџЬ1е)); 


Теперь так делать необязательно, потому что па!1ос нынче возвращает указа- 
тель на уоій, который компилятор сам приведет к нужному типу. Простейший спо- 
соб выполнить приведение – объявить переменную подходящего типа. Например 
функции, которые вынуждены принимать указатель на \019, обычно имеют такой 
ВИД: 
іпе изе_рагамекегз (уоіа *рагатѕ іп) { 


рагат ѕёгисе *рагатѕ = рагатѕ іп; // По существу, приводим указатель на ооій 
// куказателю на рағат_ѕіғисі. 


В общем случае допустимо присваивать элемент одного типа элементу другого, 
а С выполнит приведение типов самостоятельно. Если для какого-то конкретного 
типа это невозможно, то вам в любом случае придется написать функцию преоб- 
разования. В С++ это не так, поскольку система типов в этом языке строже и при- 
ведения должны быть явными. 
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Остается две причины для использования синтаксиса приведения типов пере- 
менных в С. 

Во-первых, при делении целого числа на целое возвращается целый результат, 
поэтому оба следующих утверждения истинны: 


4/2 == 
3/2 == 


Второй случай – источник многочисленных ошибок. Но поправить дело легко: 
если 1 целое, то 1 + 0.0 — число с плавающей точкой с таким же математическим 
значением, как у целого. Правда, нужно помнить о скобках, если они необходимы, 
но, в принципе, проблему можно считать решенной. В случае констант 2 – целое, 
а2.0 и даже просто 2. — число с плавающей точкой. Поэтому все приведенные 
ниже варианты работают: 
іп 6мо=2; 

3/ (&мо+0.0) = 


3/ (2+0.0) = 
3/2.0 == 


ол 


Можно использовать и приведение типов: 


3/ (аочЬ1е) мо = 5 


= 1. 
3/ (доџЬ1е) 2 == 1.5 


Мне больше нравится вариант с прибавлением нуля, по чисто эстетическим 
причинам; вы, если хотите, можете выбрать вариант с приведением к типу до 1е. 
Но не забывайте делать то либо другое всякий раз, как встречаете знак /, потому 
что пренебрежение этой мудростью – источник многих и многих ошибок (и не 
только в С; немало и других языков, которые твердо уверены, что ілі / іл => ілі – 
несмотря ни на что). 

Во-вторых, индексы массива должны быть целыми числами. Это закон (С99 и 
С11 56.5.2.1(1)), и компилятор обычно ругается, если в качестве индекса исполь- 
зовать число с плавающей точкой. Поэтому придется привести его к типу целого, 
даже если вы точно знаете, что в конкретной ситуации индекс и так будет прини- 
мать только целочисленные значения. 


4/ (аоџр1е) 2 == 2.0 // Это число с плавающей точкой, а не целое. 
ту1156 [4/ (доџЫ1е) 2] // Отсюда и ошибка: индекс с плавающей точкой 


ту11іѕЕ [ (іле) (4/ (доџЬ1е) 2) ] // Работает. Будьте внимательны со скобками 


іп іпаех=4/ (дӢоџЬ1е) 2 // Так тоже работает и к тому же понятнее 
ту1іѕе [іпаех] 


Как видите, существуют вполне оправданные причины для приведения типов, но 
даже в этих случаях есть возможность избежать приведения: прибавить 0.0 и объ- 
явить целочисленную переменную для использования в качестве индекса массива. 

И дело не только в том, что в программе становится меньше беспорядка. Ком- 
пилятор проверяет типы и при необходимости выдает предупреждения или со- 
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общения об ошибках, а явное приведение означает: оставь меня в покое, я знаю, 
что делаю. Рассмотрим, к примеру, следующую коротенькую программу, которая 
пытается выполнить действие 115%1[7]=12, но дважды совершает классическую 
ошибку: использует указатель вместо значения, на которое он указывает. 
іпЕ таіп() { 

очЬ1е х = 7; 


ЧочЬ]е *хр = &х; 
116 11$6[100]; 


іле уа12 = хр; // Сіопв предупреждает, что указатель используется как іпі 
1156 [уа12] = 12; 
11$ [ (116) хр] = 12; // С/апр не выдает никаких предупреждений 


Перечисления и строки 


Перечисления — отличная идея, зашедшая не туда. 

Достоинства очевидны: целые числа лишены мнемоничности, поэтому, собира- 
ясь использовать в программе короткий перечень целых чисел, лучше бы дать им 
какие-нибудь имена. Вот совсем плохой способ решения проблемы без использо- 
вания ключевого слова епи: 

#аеѓіпе МОВТН 0 
#аеѓіпе ЅООТН 1 


#аеїіпе ЕАЅТ 2 
#Аейпе ИЕЅТ 3 


С помощью епот мы можем свести это к одной строке кода, и отладчик правиль- 
но поймет, что такое ЕАЗТ. Следующая строка определенно лучше последователь- 
ности директив #аейпе: 


епит аігесііопѕ {МОВТН, ЅООТН, ЕАЅТ, МЕЗТ}; 


Но теперь у нас появилось пять новых символов в пространстве имен: дігесііопз, 
МОКТН, 50079, ЕАЅТ и МЕТ. 

Чтобы перечисление было полезным, оно обычно должно быть глобальным (то 
есть объявлять его нужно в заголовке, который включается во многие файлы про- 
екта). Так, часто для перечислений заводится ќурейеЁв открытом заголовке библио- 
теки. Чтобы снизить вероятность возникновения конфликта имен, авторы библио- 
тек заводят имена вида С СОМУЕВТ ЕККОК МОТ АВЗОБОТЕ_РАТН или СЬ]азСоп)Тгапз — чуть 
покороче. 

И вэтот момент безобидную и разумную идею можно отправлять на помойку. Не 
хочу я набирать такие безобразия, а использую я их настолько редко, что вынужден 
каждый раз вспоминать, как они пишутся (особенно это относится к редко встре- 
чающимся кодам ошибок или флагам – много дней проходит от одного употребле- 
ния до другого). К тому же изобилие заглавных букв воспринимается как вопль. 

Сам я предпочитаю одиночные символы - транспонирование я обозначаю бук- 
вой '', а ошибку в пути – буквой 'р'. Я считаю, что для мнемоничности этого 


160 * Часть. Язык 


достаточно – ну действительно, куда больше шансов запомнить, как пишется 'р', 
чем это заглавная абракадабра, – к тому же в пространстве имен не появляется ни 
одного нового символа. 

Я считаю, что на этом уровне соображения удобства работы важнее эффектив- 
ности, но при всем при том не стоит забывать, что элемент перечисления – обычно 
целое число, тогда как сћаг в С занимает один байт. Поэтому при сравнении эле- 
ментов перечисления приходится сравнивать числа, содержащие 16 или более бит, 
а при сравнении сраг – только 8. Так что если быстродействие – для вас значимый 
довод, то и тогда он свидетельствует не в пользу перечислений. 

Иногда приходится комбинировать флаги. Открывая файл с помощью систем- 
ного вызова ореп, мы зачастую передаем ЕОМВ|0_СВЕАТ, то есть поразрядное объеди- 
нение двух элементов перечисления. Возможно, вы редко вызываете ореп напря- 
мую, а чаще пользуетесь функцией Гореп, более дружественной к пользователю. 
Вместо перечисления ей передается строка из одной или двух букв, например "г" 
или "г+", которая говорит, что файл нужно открыть для чтения, для записи, для 
того и другого и т. д. 

В этом контексте вы понимаете, что "г" означает геаа (чтение), и эта мпемоника 
запомнится через два-три употребления Гореп, тогда как в приведенном выше при- 
мере я каждый раз должен вспоминать, как правильно: СЬ1азТгапз, СВЬАЗТгап$ или 
СЬ1а5Тгапзрозе. 

К плюсам перечислений нужно отнести небольшой фиксированный набор сим- 
волов, что позволяет компилятору диагностировать ошибку в случае опечатки 
и заставить вас внести исправление. При использовании строк вы не узнаете об 
опечатке до этапа выполнения. С другой стороны, набор строк не фиксирован, по- 
этому расширять его проще. Так, мне однажды встретился обработчик ошибок, 
который предлагали использовать в других системах – при условии, что новая 
система генерирует только те ошибки, которые прописаны в перечислении исход- 
ной системы. Если бы коды ошибок были короткими строками, расширение их 
множества оказалось бы тривиальным делом. 

Для использования перечислений есть причины: иногда имеется массив, кото- 
рый нет смысла превращать в структуру, но его элементы тем не менее именованы, 
а при программировании на уровне ядра давать имена комбинациям битов просто 
обязательно. Но в тех случаях, когда перечисления служат для задания коротко- 
го списка вариантов или кодов ошибок, одиночный символ или короткая строка 
оказываются ничуть не хуже, но без загромождения пространства имен и памяти 
программиста. 


Метки, 900, эм сп и Бгеак 


В старые добрые дни, когда программы писали на ассемблере, не было таких со- 
временных удобств, как циклы мћі]е и ѓог. А были только условия, метки и ко- 
манды перехода. Там, где мы написали бы юћі1е (а[1] < 100) 1++;, нашим предкам 
приходилось писать нечто вроде: 
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1аЪе1 1 

1Е а[1] >= 100 
до ёо 1аре1 2 

іпсгетепё 1 

до іо 1аре1 1 

1аре1 2 


Если у вас ушла целая минута, чтобы понять, что здесь происходит, подумайте, 
как это выглядело бы в реальной ситуации, когда циклы перемежаются другими 
командами, являются вложенными или прерываются досрочно. Мой личный пе- 
чальный и болезненный опыт говорит отом, что проследить поток выполнения та- 
кой программы практически невозможно, и именно поэтому команда добо в наши 
дни считается вредной [О|Кзга 1968]. 

Вы сами видите, насколько полезным оказалось бы ключевое слово мћі1е из 
языка С любому, кто вынужден целыми днями писать на ассемблере. Однако же 
в С до сих пор существует подмножество, в основе которого лежат метки и пере- 
ходы, сюда относятся собственно метки, а также ключевые слова доќо, ѕміќсћ, сазе, 
деҒаџ1, ргеак и сопїіпџе. Лично я думаю, что эта часть С – переход от приемов 
написания кода на ассемблере к более современному стилю. Ниже мы рассмотрим 
эти коиструкции и поговорим о том, когда они могут быть полезны. Вместе с тем 
надо отметить, что все это подмножество языка факультативно в том смысле, что 


можно написать эквивалентный код, не прибегая ни к одному из этих ключевых 
СЛОВ. 


К вопросу о доїо 


Строка кода на С может быть помечена, для этого перед ней нужно поставить 
идентификатор и двоеточие. Затем к этой строке можно перейти с помощью пред- 
ложения 49010. В примере 7.1 показана простая функция, иллюстрирующая эту 
идею, – метка строки называется ого. Функция вычисляет сумму всех элементов 
двух массивов при условии, что они отличны от МаМ («не число»; см. раздел «По- 
метка недопустимых числовых значений с помощью маркера МаМ» на стр. 169). 
Если какой-то элемент равен МаМ, то это считается ошибкой, и мы должны выйти 
из функции. Однако при любом способе выхода нужно предварительно освобо- 
дить оба вектора. Можно было бы включить код очистки трижды (когда в уесіог 
встречается МаМ, когда в уесіог2 встречается МаМ и когда все хорошо), но правиль- 
нее оставить один фрагмент кода и переходить на него по мере необходимости. 


Пример 7.1 + Использование до для чистой реализации выхода в случае ошибки 


/* Суммирование до обнаружения первого элемента МаМ в векторе. 
Если выход нормальный, код ошибки равен 0, если встретился МаМ, то 1.*/ 
аоџр1е зит_6о_Нгзе_пап (аоџріе* уесіог, 1пЕ уесбог ѕіге, 
доџр1е* уесіог2, іпё уесбог2 ѕіге, іп *еггог) { 
аоџЬ1е ѕит=0; 


*еггог=1; 
Еог (іпё 1=0; 1< уесеог_$12е; і++) { 
1Е (іѕпап (месёог[і])) добо оцёго; 


зим += уесіог [1]; 
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} 


Еог (іп 1=0; 1< уесіог2 ѕіғе; 1++) { 
1Е (іѕпап (уесёог2[1])) добо оцёго; 
зим += уесіог2 [1]; 

} 


*еггог=0; 


оціго: 

ргіпеё ("Тһе зим ипё1] Ее НгзЕ №№ (1Ё апу) маѕ%9\п", зим); 
Ғгее (уесіог); 

Егее (уесіог2); 

геигп зип; 


Предложение доѓо работает только внутри функции. Для перехода из одной 
функции в другую необходим совершенно другой механизм – смотрите докумен- 
тацию по функции 1019) пр из стандартной библиотеки. 

За одиночным переходом проследить сравнительно несложно, он может даже 
упростить программу, если используется умеренно и обоснованно. Даже Линус 
Торвальдс, автор ядра Глпих, рекомендует ограниченно применять 900 для таких 
целей, как выход из функции в случае ошибки, как в примере выше, или для до- 
срочного завершения обработки. Кроме того, когда в главе 12 мы будем изучать 
библиотеку ОрепМР выяснится, что из середины распараллеленного блока воз- 
врат не допускается. Поэтому чтобы остановить выполнение, нужно либо писать 
много предложений іѓ, либо перейти в конец блока с помощью д0%0. 

Поэтому, дополняя общепринятое мнение, скажем, что в общем случае доѓо луч- 
ше избегать, но в то же время это идиоматический способ обработки ошибок, ко- 
торый зачастую оказывается чище альтернативных вариантов. 


Для тех, кто хотел бы уйти подальше 


Предложение доїо полезно для выполнения сравнительно простых операций очистки 
при выходе из функции в случае ошибки. На глобальном уровне существуют три функ- 
ции «перехода к выходу»: ехіі, дџіск ех1 и Ехії, а для регистрации операций очистки 
можно воспользоваться функциями а{_ех1{ и аї аріск ехії (С11 57.22.4). 

Где-то в начале программы вызывается функция аё ех1{ (Ёп), чтобы зарегистрировать 
п для вызова из ехіё перед закрытием потоков и завершением программы. Например, 
если необходимо закрыть сеанс работы с базой данных или сетевое соединение либо 
требуется закрыть все еще открытые элементы ХМ! -документа, то можно зарегистри- 
ровать функцию, которая это сделает. Она должна иметь прототип \014 Ёп (уоій), тоесть 
любая входная информация должна передаваться ей через глобальные переменные. 
После того как все зарегистрированные функции будут вызваны (в порядке, обратном 
регистрации), закрываются открытые потоки и файлы и программа завершается. 
Совершенно другой набор функций можно зарегистрировать с помощью аі доіск. ехіі. 
Эти функции (а не те, что были зарегистрированы с помощью а ех1{) вызываются при 
обращении к ди1ск_ех1*. При таком варианте выхода буферы не сбрасываются и потоки 
не закрываются. 

Наконец, функция Ехі завершает программу максимально быстро: зарегистрирован- 
ные функции не вызываются, и буферы не сбрасываются. 

В примере 7.2 приведена простая программа, которая печатает различные сообщения 
в зависимости от того, какую не возвращающую управление функцию вы раскоммен- 
тируете. 


© 
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Пример 7.2 % Оставь надежду всяк входящий в функцию, помеченную 
спецификатором _М№ге{игп (погеїигп.с) 


#іпс1џаӢе <ѕбаіо.һ> 
#іпс1џде <опіѕёа.һ> //5ѕ1еер 
#іпсіџде <50а11р.һ> //ехіє, _Ех1ё и др. 


уоіа маі] () { 
ЕргіпЕЁ (ѕёаӢегг, "О0ОО0Оооооооо.\п"); 
} 


уоіа оп деаёћ () { 
Ғог (іпё 1=0; 1<4; 1++) 
Ерг1пЕЕ (36 4егг, "Т'м аеаа.\п"); 
} 


_Могееигп у014 ће соџпё () { © 
Рог (іпё 1=5; і --> 0;) { 
ргіпеЁ ("%1\п", 1); $1еер (1); 
} 


//аи1ск_ех1е (1); (2) 
//_Ех1е (1); 
ехіү (1); 

} 


іпЕ таіп() { 
ає аџіск ехіє (маі1); 
асехіє (ма11); 
асехіє (оп деабћ); 
һе сооп (); 


} 


© Ключевое слово Моге гп сообщает компилятору, что не нужно подготавливать 


для функции выходную информацию. 


Ө Раскомментируйте, чтобы посмотреть, что вызывают другие функции выхода. 


Предложение $мИсп 


Ниже приведен канонический фрагмент кода работы со стандартной функцией 


десорі, предназначенной для разбора аргументов в командной строке: 


сһаг с; 
мһі1е ((с = деёоре (...))) { 
ѕміёсћ (с) { 
сазе 'у': 
уегроѕе++; 
Ьгеак; 
сазе 'м': 
меідћііпд_Ёопсбіоп (); 
Ьгеак; 
сазе 'Ё': 
Еап_ЕопсЕ1оп (); 
Ббгеак; 
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Когда с == 'у', увеличивается уровень детализации, когда с == 'и', вызывается 
весовая функция ит. д. 

Обратите внимание на изобилие предложений ргеак (которые приводят к вы- 
ходу из предложения ѕнієсћ, а не из цикла мћі1е – тот продолжает выполняться). 
Предложение ѕнібсћ просто осуществляет переход к нужной метке (вспомните, 
что двоеточие как раз и обозначает метку), после чего выполнение программы 
продолжается с этого места. Таким образом, если бы после уегрозе++ не было 
ргеак, то программа радостно выполнила бы меідћііпд Ёџпсёіоп и пошла бы даль- 
ше. Это называется проваливанием. Иногда проваливание желательно, но лично 
мне это всегда казалось платой за элегантность синтаксиса ѕнісһ-саѕе, по срав- 
нению с метками и доќо. В работе [уап 4ег Глп4еп 1994, стр. 37-38] по результа- 
там исследования большого объема кода показано, что проваливание оправдано 
только в 3% случаев. 

Если риск внести тонкую ошибку, позабыв поставить бгеак или деѓаџ1ї, на ваш 
взгляд, слишком велик, то есть простое решение: не пользуйтесь 51% ср. 

Альтернативой предложению ѕніёсћ является последовательность 1іѓ и е1е: 


свакг с; 

мћі1е ((с = деборе(...))) { 
1Е (с == 'у') уегроѕе++; 
е1зе 1Ё (с == 'м') меідһііпд _ЕапсЕ1оп (); 
е15е іЁ (с == 'Ё') Еап_Еопсе1оп(); 


Она избыточна, потому что повторяется ссылка на с, но в то же время короче, 
так как не нужно в каждой третьей строке ставить ђгеак. Поскольку в таком виде 
это уже не тонкая обертка вокруг ничем не прикрытых меток и переходов, то и 
ошибку сделать труднее. 


Нерекоменлуемый тип ПЙоа 


Математические операции над числами с плавающей точкой могут вызвать проб- 
лемы в самых неожиданных местах. Легко придумать алгоритм, который вносит 
погрешность величиной всего 0,01% на каждом шаге, только вот после 1000 ите- 
раций получаются результаты, не имеющие ничего общего с действительностью. 
Целые тома написаны на тему о том, как избегать подобных сюрпризов. Мпогие 
рекомендации актуальны и по сей день, но кое-что удается решить быстро и прос- 
то: используйте тип іоџр1е вместо ћоаї, а для промежуточных вычислений не по- 
вредит и тип 10п9 Чоц]е. 

Например, авторы книги «Мтгібіпе Заепийс ЗоЁ\маге» рекомендуют избегать 
однопроходного метода вычисления дисперсии ([ОПуега 2006] стр. 24). Они 
приводят пример плохо обусловленной задачи. Как вы знаете, число с плаваю- 
щей точкой называется так, потому что десятичная точка сдвигается в нужиую 
позицию числа, которое во всем остальном не зависит от масштаба. Для просто- 
ты изложения допустим, что компьютер работает в десятичной системе счисле- 
ния; в такой системе число 23 000 000 можно было бы сохранить так же про- 
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сто, как 0.23 или 0.00023, – достаточно сместить десятичную точку. Но вот число 
23 000 000.00023 уже представляет проблему, потому что значащих цифр слиш- 
ком много (см. пример 7.3). 


Пример 7.3 + В числе типа Ноа{ невозможно сохранить так много значащих цифр 
(НоаНай.с) 


#1пс104е <5&41о.1> 


іп таіп() { 
ргіпе ("%#\п", (Поаё) 333334126.98); 
ргіпёЁ ("%#\п", (Поаё) 333334125.31); 


На моем нетбуке, где тип Поаї занимает 32 разряда, эта программа печатает: 


333334112.000000 
333334112.000000 


От точности ничего не осталось. Именно поэтому в старых книгах по вычис- 
лительной математике так много внимания уделялось алгоритмам, которые ми- 
нимизируют погрешность, связанную с тем, что надежных значащих цифр всего 
семь. 

Так обстоит дело с 32-разрядным типом йоаѓ, который на сегодняшний день яв- 
ляется самым узким типом с плавающей точкой. Мне даже пришлось явно выпол- 
нить приведение к йоаї, потому что иначе система представляла эти числа в виде 
64-разрядных значений. 

64 разрядов достаточно для надежного хранения 15 значащих цифр: предста- 
вить число 100 000 000 000 001 больше не проблема. (Попробуйте сами! Подсказ- 
ка: ргіпі# (%.209, ча1) печатает уа! с 20 значащими десятичными цифрами.) 

В примере 7.4 приведена реализация алгоритмов из книги Оливейра и Стюарта, 
в том числе однопроходный алгоритм вычисления среднего и дисперсии. Повто- 
рю, что этот код служит лишь для демонстрации, потому что в библиотеке СЗТ. 
ужеесть готовые калькуляторы среднего и дисперсии. Приведены две версии кода: 
одна – плохо обусловленная, на которой у авторов в 2006 году получились ужа- 
сающие результаты, а вторая – с вычитанием 34 120 из каждого числа, в результате 
чего получаются значения, для которых даже при использовании типа ћоаї удает- 
ся добиться приемлемой точности. Ну а если входные данные не являются плохо 
обусловленными, то можно с уверенностью утверждать, что результаты точны. 


Пример 7.4 + Плохо обусловленная задача: теперь не проблема (5їадеу.с) 


#1пс1и4е <таёһ.һ> 
#іпс1џде <з&91о.Н> //512е_& 


фуредеё зегисЕ меапуаг (Ядоџр1е теап, уаг;} теапуаг; 


пеапуаг теап апа уаг (сопѕє аоџЬ1е *4ака) { 
1оп4 ЯоџЬ1е ауд = 0, © 
ау92 = 0; 
1опд Яоџр1е габіо; 


166 < Часть |. Язык 


ѕіғе Е спі= 0; 


Еог (ѕіғе Е 1=0; !15пап (даба [1]); 1++) { 
габіо = спё/ (сп+1.0); 
СПЕ ++; 


ауд *= гаііо; 
ау92 *= гаііо; 
ауд += ааба [і] / (спі +0.0); 
а\уд2 += ром (даба [і], 2) / (сп +0.0); 
} 
гебигп (теапуаг) {.теап = ауд, ө 
.уаг = ауд2 - ром (ауд, 2) }; //Е[х^2] - Е^2 [х] 
} 


іпЕ таіп() { 
ЧочЬ1е 4[] = { 34124.75, 34124.48, 
34124.90, 34125.31, 
34125.05, 34124.98, МАМ}; 


пеапуаг му = теап апа уаг (а); 
ргіпіёЁ ("теап:%.109 уаг:%.109\п", ту.теап, му.уаг*6/5.); 
аоџЬ1е 42[] = { 4.75, 4.48, 

4.90, 5.31, 

5.05, 4.98, МАМ}; 


ту = теап апа уа (42); 
пу.уаг *= 6./5; ө 
ргіпеЁ ("теап:%.109 уаг:%.109\п", ту.теап, му.уаг); Ө 


} 


© Вообще говоря, использование более высокой точности для вычисления про- 
межуточных результатов помогает избежать накопления ошибок округления. 
То есть если конечный результат должен иметь тип доц ]е, то ауд, ауд2 и гаіо 
следует объявить как 10пд їоџр1е. Изменятся ли результаты в этом примере, если 
мы всюду будем использовать тип доџр1е? (Ответ: нет.) 

Ө Функция возвращает структуру, созданную с помощью позиционных инициа- 
лизаторов. Если вы еще незнакомы с этой формой, то скоро познакомитесь. 

Ө Функция в предыдущей строке вычислила дисперсию генеральной совокупно- 
сти; масштабируем для получения дисперсии выборки. 

Ө В качестве форматных спецификаторов в ргіпі я указал%9; такой специфика- 
тор принимает значения обоих типов: Поаї и доц е. 


Вот какие получились результаты: 


меап: 34124.91167 уаг: 0.07901676614 
пеап: 4.911666667 уаг: 0.07901666667 


Средние отклоняются от 34 120, потому что мы так организовали вычисления, 
но в остальном практически одинаковы (если мы бы позволили, то цифры .66666 
таки печатались бы до конца страницы и дальше), и дисперсия при плохо обуслов- 
ленных данных отклоняется от истинной всего на 0.000125%. Плохая обусловлен- 
ность не дает заметного эффекта. 
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Это, любезный читатель, технический прогресс. Стоило нам удвоить объем па- 
мяти под задачу, как все трудности испарились. Да, можно построить реальный 
пример, когда накопление погрешностей способно создать проблемы, но сделать это 
гораздо труднее. И даже если между временем выполнения программ, написанных 
с использованием йоџр]е и йоаї, существует поддающаяся измерению разница, то 
несколькими лишними микросекундами можно пожертвовать, чтобы избежать 
других мучений. 

Следует ли использовать тип 1опд іпї всюду, где раньше использовались прос- 
то целые? Этот вопрос далеко не так очевиден. Представление числа п типом 
9046 1е точнее, чем типом Поаї, хотя речь в обоих случаях идет о приближениях; 
но представления чисел, не превышающих двух миллиардов, типами ілі и 1019 
116 в точности идентичны. Единственная проблема – переполнение. Было время, 
когда предел был шокирующе маленьким - порядка 32 000. Хорошо все-таки жить 
в наше время, когда диапазон целых чисел в типичной системе составляет пример- 
но +2,1 миллиарда. Но если имеется хотя бы отдаленная возможность, что в ре- 
зультате умножений переменная окажется больше нескольких миллиардов (а это 
всего-то 200 х 200 х 100 х 500), то, безусловно, следует использовать тип 1019 114 
или даже 10п9 10п9 іпі, иначе ответ будет не просто неточным, а совершенно не- 
правильным, потому что в большинстве систем переход через границу +2,1 мил- 
лиарда приводит к циклическому возврату к величине —2,1 миллиарда. Загляните 
в файл Дтиз./ в своей системе (обычно он находится в каталоге /псіийе или /и5/ 
тсшае/); на моем нетбуке этот файл говорит, что типы ілі и 10пд 11 одинаковы. 

Если вы занимаетесь серьезными вычислениями, включайте директиву #іпсІоае 
«511 .1> и пользуйтесь типом ілілах ї, верхняя граница которого гарантирован- 
но составляет не менее 263 – 1 =9 223 372 036 854 775 807 (С99 57.18.1 и С11 67.20.1). 

Если вы все-таки соберетесь поменять типы, не забудьте во всех вызовах ргіпіѓ 
заменить спецификатор%і на%11 в случае 10пд іпї и на%јі в случае іпілах #. 


Сравнение чисел без знака 


Ниже приведена простая программа, в которой ілі сравнивается с ѕіге ї - без- 
знаковым целым типом, который иногда используется для представления адресов 
памяти (формально это тип, который возвращает $12е0Е): 


Пример 7.5 * Сравнение целых со знаком и без знака (иіпї.с) 
#іпс1іџае <5&41о.1> 


іпЕ таіп() { 
1106 пед = -2; 
512е_Е 2его = 0; 
іЁ (пед < 2его) ргіпёЁ("Да, -2 меньше 0.\п"); 
е1зе ргіпёЁ ("Нет, -2 не меньше 0.\п"); 


Запустите программу и убедитесь, что она печатает неправильный ответ. Этот 
пример показывает, что в большинстве операций сравнения целых со знаком и 
без знака С принудительно приводит знаковый тип к беззнаковому (С99 и С11 
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$6.3.1.8(1)), что прямо противоположно интуитивно ожидаемому. Признаюсь, я 
сам несколько раз нарывался на это, а найти такую ошибку очень трудно, потому 
что сравнение выглядит абсолютно естественно. 

В языке С есть много способов представления числа – от опѕідпей зћогї іпё до 
1опд ӣоџЬ1е. Такое изобилие типов было необходимо во времена, когда даже у боль- 
ших ЭВМ объем памяти измерялся килобайтами. Но сегодня не стоит использо- 
вать всё это многообразие. Чрезмерно детальное управление типами, например 
применение йоа ради повышения эффективности, а до\]е – только в особых 
случаях, или объявление переменной типа ипѕідпей іп, потому что вы уверены, 
что отрицательное значение для нее невозможно, - все это открывает двери для 
тонких ошибок, связанных с неточностью представления чисел и интуитивно пе- 
очевидными правилами преобразования типовв С. 


Безопасное преобразование строки в число 


Существует несколько функций для разбора текстовых строк с целью выделения 
числа. Самые популярные - аѓоі и аѓоѓё (АЗСП-ю-шё и АЅСП-ќо-Поаё). Работать 
с ними очень просто: 


сһаг &ме1уе[] = "12"; 
іпЕ х = абоі (ёме1уе); 


сһаг м11110п(] = "1еб"; 
аоџр1е м = ао (ті11іоп); 


Но никакой проверки ошибок в них нет: если переменная {ме1уе содержит стро- 
ку "ХІІ", то аїоі (мече) вернет 0, и программа продолжит работу. 

Более безопасны функции $1401 и ѕігіой. Они появились еще в стандарте С89, 
но остаются не слишком востребованными, потому что не упоминаются в первом 
издании книги К&К, да и для работы с ними нужно приложить чуть больше уси- 
лий. Большинство знакомых мне авторов (в том числе ия сам в предыдущей кни- 
ге) не упоминают их вовсе или выносят в приложение. 

Функция ѕёгіой принимает второй аргумент, указатель на указатель на сћаг, 
который указывает на первый символ, который анализатор не смог интерпрети- 
ровать как часть числа. Его можно использовать для разбора оставшейся части 
текста или для контроля ошибок, если вы ожидаете, что строка должна содержать 
только число и ничего более. Если объявить эту переменную как сћаг *епа, то после 
разбора строки, которая содержит только число, епа будет указывать на '\0' в кон- 
це строки, поэтому для диагностики ошибки достаточно написать что-то вроде 1Ё 
(*епа) ргіпё# ("ошибка чтения"). 

В примере 7.6 приведена простая программа, которая возводит в квадрат число, 
заданное в командной строке. 


Пример 7.6 * Применение ѕігїоа для чтения числа (ѕїгіоа.с) 


#іпс10џдӢе "ѕіорі#.һ" 
#іпс1џде <5.а11ір.һ> //ѕёгіоа 
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#1пс1 иде <таёћ.һ> //ром 


116 ма1п(1п6 агдс, сһаг **агду) { 

З6Еор1Ё (агдс < 2, геигп 1, "Задайте в командной строке число, " 
"которое нужно возвести в квадрат."); 

сһаг *епа; 

аоџЬ1е іп = ѕігбоа (агду[1], &епа); 

ЗЕор1Ё (*епа, геигп 2, "Ошибка при преобразовании '%5' в число. " 

"Проблема, начиная с '%5'.", агду[1], епа); 
ргіпіЁ ("Квадрат%ѕ равен%д\п", агду[1], ром (іп, 2)); 


Начиная со стандарта С99, существуют также функции ѕігіоѓ и ѕ#гїіо1а для пре- 
образования строки в Поаї и 1019 доче. Функции ѕёгїо] и зїгіо11 для преобразо- 
вания в 1019 іп и опо 1опд 11%, соответственно, принимают три аргумента: пре- 
образуемую строку, указатель на конец и основание системы счисления. Обычно 
задается основание 10, но можно указать 2 для чтения двоичных чисел, 8 – для 
восьмеричных, 16 – для шестнадцатеричных ит. д. вплоть до 36. 


Пометка недопустимых числовых значений с помощью маркера МаМ 


Надо выстоять, выстоять надо, 
Деление на нуль надвигается, 
как разборщиков бригада. 
— Тһе Оҝ#ѕргіпо 
«Оіміаіпо Бу гего» 
В стандарте ІЕЕЕ представления чисел с плавающей точкой сформулированы точные 
правила, в том числе специальные представления положительной и отрицательной 
бесконечности и нечисла (МаМ) – маркера, обозначающего математическую ошибку 
типа 0/0 или 109(-1). 1ЕЕЕ 754/ЕС 60559 (так официально называется этот стандарт, 
потому что люди, занимающиеся подобными вещами, предпочитают, чтобы у стандар- 
тов были числовые названия), отличается от стандартов С иРОЅІХ, но поддерживается 
почти всюду. Если вы работаете на компьютере Сгау или на каком-то узкоспециализи- 
рованном встроенном устройстве, то изложенные в этом разделе подробности можете 
проигнорировать (но даже в библиотеке АМ Іібс для Агаиіпо и других микроконтролле- 
ров определены константы МАМ и ІМЕІМІТҮ). 
Как видно из примера 10.1, маркер МаМ может быть полезен для обозначения конца 
списка при условии, что в самом списке гарантированно нет значений Мам. 
Еще одна вещь, которую нужно обязательно знать о МаМ, - тот факт, что сравнение 
с этим значением на равенство всегда заканчивается неудачно - после присваивания 
х=МАМ даже вычисление выражения х==х дает їаіѕе. Чтобы проверить, совпадает ли х 
с МаМ, нужно воспользоваться функцией 15пап (х). 
Тех, кому приходится постоянно заниматься численными расчетами, могут заинтересо- 
вать другие способы использования МаМ в качестве маркера. 
В стандарте ІЕЕЕ определено множество форм МаМ: знаковый бит может быть равен 0 
или 1, показатель степени должен содержать только единицы, а все остальное отлично 
от нуля, то есть получается такая последовательность битов: 511111111 ММММММММ 
МММММММММММММММ, где $ - знак, а М – неопределенная мантисса. 
Нулевая мантисса означает +бесконечность в зависимости от знакового бита, но 
в остальном мы свободны в качестве М выбирать все, что угодно. Придумав, как интер- 
претировать эти биты, мы сможем включать различные признаки в числовые массивы. 
Изящный способ сгенерировать конкретное нечисло - воспользоваться функцией 
пап (ќадр), которая возвращает нечисло, «содержимое которого определяется парамет- 
ром ѓадр». (С99 и С11 87.12.11.2). Параметр должен быть строкой, представляющей 
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число с плавающей точкой, – функция пап обертывает функцию ѕігіоа – которое будет 
записано в мантиссу создаваемого нечисла. 

Программа в примере 7.7 генерирует и использует маркер МА (нет данных), полезный 
в контексте, когда нужно различать отсутствующие данные и математические ошибки. 


Пример 7.7 % Создание собственного маркера МА для аннотации данных с плавающей 
точкой (па.с) 


#іпс1џае <зЕ41о.Н> 
#1пс1и4е <таёћ.һ> //МАМ, іѕпап, пап 


аоџЬ1е ге; 
аоџр1е ѕеб па () { 


1Е (!ге#) геё=пап ("21"); 
геогп геї; 


іпё іѕ па (аоџр1е іп) { © 
1Е (!геЁ) гебогп 0; //ѕеб па еще не вызывалась ==> маркеров МА пока нет. 
сһаг *сс = (сһаг *) (&іп); 
сһаг *сг = (сһаг *) (&геЁ); 
Ғог (іп 1=0; 1< $з12еоЕ (аоџр1іе); і++) 
іЁ (сс[1) != сг[1)) гебогп 0; 
гебогп 1; 
} 
106 таіп() { 
дӢоџр1е х = зеі па(); 
аоџЬ1е у = х; 


ргіпеЁ("Іѕ х=ѕе па() МА?%і\п", іѕ па(х)); 
ргіпеЁ ("Іѕ х=ѕеё па() МАМ?%і\п", ізпап(х)); 
ргіпеЁ ("Іѕ у=х МА?%1\п", іѕ па (у)); 

ргіпіЁ ("Іѕ 0/0 МА?%1\п", іѕ па (0/0.)); 
ргіпіё ("Іѕ 8 МА?%1\п", іѕ па(8)); 


— 


© Функция 15 па сравнивает комбинацию бит проверяемого числа со специальной 
комбинацией бит, заданной с помощью ѕеї па. Для этого она рассматривает обе ком- 
бинации как символьные строки и производит посимвольное сравнение. 


Я создал один признак, записываемый вместо числа, произвольно выбрав в качестве 
ключа число 21. Немного модифицировав этот код, мы сможем сгенерировать сколько 
угодно различных маркеров для обозначения различных исключительных ситуаций. 

На самом деле некоторые широко распространенные системы (например, МеБкКії) идут 
гораздо дальше и вставляют в мантиссу нечисел не просто признак, а настоящий ука- 
затель. Реализацию этого метода, который называется упаковкой в Мам (МаМ Бохтд), 
оставляю читателю в качестве упражнения. 
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Важные особенности 
синтаксиса С, 

которые в учебниках 
часто не рассматриваются 


В предыдущей главе рассматривались некоторые вопросы, которым в традици- 
онных учебниках С уделяется много внимания, но которые при работе на совре- 
менных компьютерах уже не так существенны. В этой главе мы рассмотрим темы, 
которые, как я обнаружил, во многих учебниках не рассматриваются вовсе или 
затрагиваются вскользь. Как и выше, обсуждается много мелких вопросов, объ- 
сдиненных в три крупных раздела. 

О Препроцессор часто незаслуженно обходят вниманием, наверное, потому 
что многие думают, будто это какой-то вспомогательный инструмент, а не 
пастоящий С. Однако он включен не без причины: есть вещи, которые в С 
можно сделать только с помощью макросов. Не все совместимые со стандар- 
тами компиляторы предлагают одинаковый набор средств, и именно с по- 
мощью препроцессора мы распознаем характеристики окружения и так или 
иначе реагируем на них. 

О Делая обзор учебников С, я наткнулся на одну-две книги, в которых клю- 
чевые слова ѕіаїіс и ехѓегп даже не упоминаются. Поэтому в этой главе мы 
потратим некоторое время на обсуждение компоновки и рассмотрим плохо 
понимаемые применения ключевого слова ѕіаїіс. 

О Ключевое слово сопѕї попало в эту главу, потому что оно настолько полезно, 
что не использовать его было бы преступлением, но при этом его описание 
в стандарте и реализация в распространенных компиляторах содержит не- 
которые странности. 
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Вырашивание устойчивых и плолоносяших 
макросов 


В главе 10 описывается несколько способов сделать интерфейс с библиотекой 
более дружелюбным к пользователю и менее подверженным ошибкам. Для этой 
цели активно применяются макросы. 

Мне не раз доводилось слышать, будто макросы — сами по себе источник 
ошибок и потому их следует избегать, но люди, которые так говорят, почему-то 
не советуют отказаться от МОШ, іѕа1рћа, іѕћіпіѓе, аззеге, обобщенных функций, 
адаптирующихся к типу аргументов, в частности 109, $11, с0$ и ром, а также десят- 
ков других средств, которые в стандартной библиотеке СМО реализованы в виде 
макросов. И это надежные, правильно написанные макросы, которые в любых об- 
стоятельствах делают то, для чего предназначены. 

Макрос производит текстовую подстановку (которая называется расширением 
в предположении, что подставляемый текст длиннее исходного), а к этой опера- 
ции следует относиться иначе, чем к вызову функции, потому что входной текст 
может взаимодействовать с текстом в макросе и соседним текстом в исходном 
коде. Макросы лучше использовать в тех случаях, когда такое взаимодействие же- 
лательно и предотвращать его нет необходимости. 

Прежде чем переходить к правилам написания надежных макросов – а их всего 
три, – давайте выделим два типа макросов. В первом случае результатом расши- 
рения является выражение, а это значит, что мы можем вычислять такие макро- 
сы, печатать их значения или - если результаты числовые – использовать внутри 
уравнения. Во втором случае расширение дает блок предложений, который может 
встречаться после 1# или в цикле мћі1е. А теперь сами правила. 

О Скобки! Очень легко получить не то, что ожидаешь, после того как макрос 

вставит какой -то текст. Вот простой пример: 


#адейпе 4оцЬ1е (х) 2*х Нужны дополнительные скобки. 


Если теперь пользователь напишет йоџр1е (1+1) *8, то в результате расшире- 
ния макроса получится 2*1+1*8, чтодает 10, ане 32. Чтобы все было правиль- 
но, нужно добавить скобки: 


#аейпе ЯаоџЬ1е (х) (2* (х)) 


Теперь вычисление (2* (1+1) ) *8 дает правильный результат. Общее правило 
состоит в том, чтобы заключать в скобки все входные параметры, если нет 
особых причин поступить иначе. Для макросов, расширяющихся в выраже- 
ние, сам результат макроса также нужно заключать в скобки. 

О Избегайте двойной подстановки. Следующий пример из учебника несет в 
себе опасность: 


#аеНпе тах (а, Ь) ((а) > (Ы) ? (а) : (Ы)) 
Написав іпё х=1, у=2; іпё п=тах (х, у++), пользователь ожидает, что п будет 


равно 2 (значение у до инкремента), после чего у примет значение 3. Но 
макрос-то расширяется следующим образом: 
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м = ((х) > (у++) ? (х) : (у++)) 


а это означает, что у++ вычисляется дважды, то есть инкремент выполняется 
два раза, хотя пользователь ожидал однократного, и в результате т будет 
равно 3, а не 2. 
В случае макроса блочного типа мы можем в начале блока объявить пе- 
ременную, которая принимает значение, равное входному параметру, и 
в остальной части макроса использовать эту копию. 
Этому правилу следуют не так безусловно, как правилу скобок – макрос пах 
часто встречается в неожиданных местах, — поэтому помните, что побочные 
эффекты внутри неизвестных макросов следует сводить к минимуму. 

О Фигурные скобки для блоков. Вот простой блочный макрос: 
#аеѓіпе доџЬ1еіпсгетепё (а, Ъ) \ Нужны фигурные скобки. 


(а) ++; 
(6) ++; 


Он сделает совершенно не то, что нужно, если поставить его после 1Ё: 


іпё х=1, у=0; 
1Ё (х>у) 
дооџр1еіпсгетепі (х, у); 


Если добавить отступы, чтобы сделать ошибку очевидной, то мы увидим 
такой результат расширения: 
116 х=1, у=0; 
іЁ (х>у) 
(х) ++; 
(у) ++; 


Еще один подвох: что, если в макросе объявлена переменная ѓоѓа1, а поль- 
зователь уже объявил такую же переменную в объемлющей программе? Пе- 
ременные, объявленные в блоке, конфликтуют с одноименными перемен- 
ными, объявленными вне блока. В примере 8.1 показано простое решение 
обеих проблем: заключайте макрос в фигурные скобки. 

Если весь макрос заключен в фигурные скобки, то мы можем завести проме- 
жуточную переменную с именем ѓоѓа1, которая будет существовать только 
в области видимости внутри этих фигурных скобок и никак не испортит 
переменную ѓоѓа1, объявленную в таіп. 


Пример 8.1 * Мы можем управлять областью видимости с помощью 
фигурных скобок, каки в обычном коде безо всяких макросов (сипу.с) 
#1пс1и4е <5аіо.һ> 


#аейпе ѕит (тах, оџё) { \ 
іп ёоба1=0; \ 
Еог (іпё 1=0; 1<= тах; 1++) \ 
сока] += і; \ 
оиЕ = боба1; \ 
} 


іпё малп() { 
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іпЕ оцЕ; 

116 боба] = 5; 

зип (5, оиё); 

ргіпеЁ ("оџё=%1 огідіпа1 боба1=%і\п", ошё, боѓа1); 


} 


Но одна мелкая шероховатость все-таки остается. Вернемся к простому 
макросу ӣооЬ1еіпсгетепї; код 


#аеїіпе доџр1еіпсгетепё (а, ЬЫ) { \ 
(а) ++; \ 
(Ы) ++; \ 


) 


1ЁЕ (а>ь) аоџр1еіпсгетепі (а, БЫ); 
е1зе гевигп 0; 


расширяется в: 


1Е (а>ь) { 

(а) ++; 

(6) ++; 
}; 
е1зе гевигп 0; 
Лишняя точка с запятой перед е1зе смущает компилятор. Пользователь 
получит сообщение об ошибке компиляции и, стало быть, поставлять за- 
казчику такой код нельзя, однако решение - убрать точку с запятой или 
заключить предложение в дополнительные фигурные скобки, кажущиеся 
совершенно излишними, - не очевидно, и интерфейс такого макроса не 
назовешь прозрачным. Честно говоря, тут мало что можно сделать. Ти- 
пичное решение – обернуть макрос в однократно исполняемый цикл 90- 
мБ! ]е: 


#аеїіпе аоџр1еіпсгетепё (а, Ь) ао { \ 
(а) ++; \ 
(р) ++; \ 

} мһі2е (0) 


іЁ# (а>Ь) аоџр1еіпсгетепі (а, ЬЫ); 
е1зе геіџгп 0; 


Это решает проблему, и мы получаем макрос, про который пользователи 
могут и не знать, что это макрос. Но что, если в макросе имеется предло- 
жение ргеак — встроенное или каким-то образом включенное пользовате- 
лем? Вот очередной пример макроса утверждения и случай, когда он не 
работает: 

#Аейпе АпАззеге (ехргеѕѕіоп, асбіоп) ао { \ 


іЁ (! (ехргеѕѕіоп)) асёіоп; \ 
} мһі1е(0) 


аӢоџр1е ап аггау[100]; 
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аоџр1е боёа1=0; 


Ғог (іп 1=0; 1< 100; 1++) { 
АпАѕѕегї (! (іѕпап (ап аггау[і])), Бргеак); 
Соба1 += ап аггау[і]; 


} 


Пользователь не знает о том, что заданное им предложение ргеак оказыва- 
ется в цикле о-нћі1е, внутреннем для макроса, поэтому откомпилирует и 
запустит неправильный код. В тех случаях, когда обертка о-юћі1е может на- 
рушать ожидаемое поведение бгеак, пожалуй, проще всего убрать обертку и 
предупредить пользователей о неприятности, касающейся точки с запятой 
перед е1ѕе!. 

Выполнив команду дсс -Есиг1у. с, мы увидим, что препроцессор расширяет мак- 
рос зим, как показано ниже, и благодаря наличию фигурных скобок переменная 
оѓа1 в области видимости макроса никак не влияет на переменную +0*а1 в области 
видимости паіп. Поэтому будет напечатано значение ѓоѓа1, равное 5: 
іп таіп() { 

іп оџё; 
іпе ёоёа1 = 5; 

{ іп Соба1=0; Ғог (іп 1=0; 1<= 5; 1++) ёоба1 += 1; оџЕ = 60а]; }; 

рге1пЕЁ ("о0џё=%1 6о6а1=%1\п", ооё, боба1); 


ГАХ Ограничение области видимости макроса с помощью фигурных скобок не защищает от 
А ув всех видов конфликтов имен. Что случится в предыдущем примере, если мы напишем ілі 
ОИ, 1=5; зим (1, 0иё); ? 


б ‚ Если имеется подозрительный макрос, запустите асс, Сіапо или ісс с флагом -Е, в резуль- 
\ тате отработает только препроцессор, и расширенная версия обрабатываемого файла 
будет выведена на $140щ. Поскольку сюда входит и содержимое #1пс1и4е <5{910.1> и про- 
чих весьма объемных стандартных файлов, то я обычно перенаправляю вывод в файл или 
в программу постраничного просмотра командой дсс -Е пусоде.с | 1е55, а уже затем ищу 
расширения отлаживаемого макроса. 


Вот, собственно, и все, что можно сказать о капризах макросов. Основной 
принцип – стремиться к простоте макросов – сохраняет силу, и, как вы убеди- 
тесь, реальные макросы чаще всего умещаются в одну строку, их задача – тем или 
иным способом подготовить параметры, а затем вызвать стандартную функцию 
для выполнения реальной работы. Отладчик и сторонние системы не располага- 
ют средствами разбора макроопределений, поэтому все написанное вами должно 
работать и без макросов. В разделе «Компоновка с ключевыми словами $айс и 
ехѓегп» ниже приводится рекомендация о том, как упростить себе жизнь при на- 
писании простых функций. 


' Существует также возможность обернуть блок в предложение 1# (1) {.. } е1зе (уо1а) 0, кото- 


рое тоже поглощает точку с запятой. Технически это работает, но приводит к предупреж- 
дению компилятора, когда сам макрос вложен в предложение 1Е-е15е и задан флаг -На11. 
Поэтому такое решение тоже не вполне прозрачно для пользователя. 
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Приемы работы с препроцессором 


Знак решетки #, зарезервированный для препроцессора, используется последним 
тремя совершенно разными способами: для обозначения директив, для преобразо- 
вания аргументов в строку и для конкатенации лексем. 

Как вы знаете, директива препроцессора, например #іећпе, должна начинаться 
знаком # в начале строки. 

Попутно отметим, что пробелы, предшествующие знаку #, игнорируются (К&К, 
2-е издание, $А12, стр. 228), и это полезно с точки зрения оформления кода. На- 
пример, одноразовые макросы можно поместить внутрь функции, непосредствен- 
но перед тем местом, где они используются, с таким же отступом, как в самой 
функции. Согласно воззрениям старой школы, размещение макроса в месте ис- 
пользования — свидетельство «неправильной» организации программы (а пра- 
вильно – располагать все макросы в начале файла), но, располагая макросы по 
месту, мы упрощаем себе ссылку на них и подчеркиваем их одноразовую природу. 
В разделе «ОрепМР» на стр. 293 мы будем аннотировать циклы ог директивами 
#ргадпа, и размещение знака # в первой позиции строки превратило бы текст про- 
граммы в нечитаемый хаос. 

Следующее использование знака # — преобразование аргумента макроса в стро- 
ку. Программа в примере 8.2 демонстрирует одну особенность оператора $12е0# (см. 
врезку), но ее основная цель – показать использование макроса препроцессора. 


Пример 8.2 < Текст одновременно печатается и вычисляется ($2е$01.с) 
#іпс10џае <з&а1о.Н> 


#АеНпе Реуа1 (ста) рг1п\Ё(#ста ":%9\п", ста); 


іпе таіп() { 
ЧоцЬ1е *р115Е = (аоџЬ1е[]) (1, 2, 3}; © 
доџЬ1е 113%[] = {1, 2, 3}; 


Реча1 ($12е0# (р1134) / ($12еоЕ (аоџЬ1е) +0.0)); 
Ре\уа1 ($12е0# (1156) / (5іг2еоѓ (аоџр1е) +0.0)); 
} 


© Это составной литерал. Если вы с ними незнакомы, подождите немного, я рас- 
скажу позже. Глядя нато, как 312е0Ё обрабатывает р115ї, помните, что р113{ – это 
указатель на массив, а не сам массив. 


Выполнив эту программу, вы увидите, что аргумент макроса печатается как 
обычный текст, а затем его значение вычисляется, поскольку #спа эквивалентно 
строке "сті". Таким образом, Рета] (1131 [0] } должно было бы быть расширено в: 


рге1пеЁ ("1136 [0]" ": %9\п", 11$6[0]); 


Вас смущают две строки "11$1[0]" ":%9\п", расположенные вплотную друг 
к другу? Следующий трюк препроцессора заключается в том, что две соседпие 
литеральные строки объединяются в одну: "1154 [0] :%9\п". И это справедливо ие 
только по отношению к макросам: 


к 
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ргіпеЁ ("Конкатенацию строк препроцессором " 
"можно использовать для разбиения длинных " 
"строк в программе. Мне кажется, что это " 
"проще, чем использовать знак обратной " 
"косой черты, но следите за пробелами."); 


Ограничения ѕігеоѓ 


Вы попробовали запустить код из предыдущего примера? Он основан на известном 
трюке, позволяющем получить размер автоматического или статического масси- 
ва путем деления общего размера массива на размер одного его элемента (Һ№р:// 
с-Ғад.сот/агурїг/аггаупеіѕ.Һті; см. также К&В, 1-е издание, стр. 126; 2-е издание, 
стр. 135), например: 


// Это ненадежно: 
{Аейпе аггау$12е (115%) 312е0ЕЁ (113%) /ѕігеоЁ (1136[0]) 


Оператор $17е0# (это ключевое слово С, а не обычная функция) применяется к автома- 
тически выделенной переменной (которая может быть массивом или указателем), а не 
к данным, на которые направлен указатель. В случае автоматического массива вида 
доче 115#[100] компилятор должен выделить память для 100 чисел типа доче и по- 
заботиться о том, чтобы эту область (скорее всего, 800 байт) не затерла следующая 
переменная, размещенная в стеке. В случае динамически выделенной памяти (іоџр1е 
*р11ѕі; р11$# = па110с (512е0 (дочЫ]е *100) ) ; ) указатель в стеке занимает, наверное, 8 бай- 
тов (ну уж заведомо не 100), и ѕігеої возвращает длину этого указателя, а не того, на 
что он указывает. 

. Когда вы указываете пальцем на игрушку, одни кошки обследуют игрушку, а другие об- 
нюхивают ваш палец. 


А бывает, что нужно соединить два объекта, не являющиеся строками. В этом 
случае используются два знака решетки подряд: ##. Если переменная папе прини- 
мает значение Ш, то конструкция папе ## 115 преобразуется в Ш 115 — это допус- 
тимое имя переменной, которым можно воспользоваться в программе. 

«А вот хотелось бы, – слышу я ваше замечание, — чтобы с каждым массивом 
была ассоциирована переменная, содержащая его длину». Что ж, в примере 8.3 
приведен макрос, который объявляет локальную переменную с именем, оканчи- 
вающимся на ]еп, для каждого интересующего вас списка. Он даже позаботится 
о паличии завершающего маркера у списка, так что и длина-то не нужна. 

Впрочем, сам по себе такой макрос – перебор, и я не рекомендую сразу же бро- 
саться применять его, однако он демонстрирует, как можно сгенерировать мно- 
жество временных переменных с единообразно устроенными именами. 


Пример 8.3 * Создание вспомогательных переменных с помощью препроцессора 
(ргергосеѕѕ.с) 


#1пс1и4е <51аіо.һ> 
#іпс1џае <таєһћ.һ> //МАМ 


#Аейпе Ѕеёир 1іѕё (пате, ...) \ 
ЧоцЬ1е *пате ## 1156 = (доџр1е []){__\УА_АВб$__, МАМ); \ Ф 
іпё пате ## _1еп = 0; \ 
Ғог (пате ## _1еп =0; \ 
!іѕпап (пате ## 1136 [пате ## _1еп]); \ 
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) пате ## _1еп ++; 


106 ма1п() { 


Зекир_115% (ібетѕ, 1, 2, 4, 8); ө 
доџр1е ѕит=0; 
Ғог (аоџр1е *рёг= ібетѕ 11ѕё; !іѕпап(*рёг); рёг++) Ө 


зим += *рёг; 
ргіпЕЁ ("Соёа1 Ёог ібетѕ 1136:%9\п", зим); 


#Чейпе ГепдеВ (іп) зп ## _1еп [4/ 


ѕит= 0; 

Зееир_115% (пех ѕе, -1, 2.2, 4.8, 0.1); 

ог (іп 1=0; 1 < 1епдёһ (пех ѕеб); 1++) 5 
зим += пех ѕе 1156[1]; 

ргіпеё ("ёоба1 Ёог пехі зеё 11і5ѕЕ: %9\п", зим); 


} 


© В левой части показано использование ## для порождения имени переменной 
по шаблону. Правая часть предвосхищает обсуждение макросов с переменным 
числом аргументов в главе 10. 

Ө Порождаются переменные іёетѕ Іеп и ібетѕ 115. 

Ө Цикл с применением Мам в качестве маркера. 

Ө В некоторых системах разрешается запрашивать у массива его собственную 
длину, как показано здесь. 


Ө Это цикл, в котором используется переменная пех ѕе 1ел, содержащая длину 
массива. 


Попутно сделаем стилистическое замечание: исторически было принято отли- 
чать макросы от функций, записывая их имена заглавными буквами. Это служило 
предостережением о возможных сюрпризах из-за подстановки текста. Мне такая 
запись напоминает вопль, поэтому я предпочитаю делать заглавной только пер- 
вую букву имени макроса. Другие вообще не обращают внимания на регистр букв. 


Аргументы макроса необязательны 


Вот разумный макрос утверждения, который возвращает информацию о том, что 
утверждение ложно: 


#аеїіпе Теѕіс1аіт (аѕѕегёіоп, геёцгпуа1) 1Ё (! (аѕѕегёіоп)) \ 
{ Ере1пЕЕ (56 4егг, #аѕѕегііоп " Ғаі1еа іо ре гие. \ 
Кеџгпіпд " #гесигпуа]1 "\п"); геџгп гесигпуа1; } 


Вот пример его использования: 


116 ао ёћіпдѕ () { 
Ех, у; 


Теѕіс1аіт(х==у, -1); 


геёогп 0; 
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Но что, если функция не возвращает значение? В таком случае второй аргумент можно 
оставить пустым: 


уоіа ао оёћег {11п9$3 () { 
іпЕ х, у; 


ТеѕёсІаіт(х==у, ); 


гебигп; 


} 


Тогда последняя строка макроса расширяется в ге{игп ;, что вполне допустимо и соот- 
ветствует функции, возвращающей уо14'. 
При желании можно даже реализовать значения по умолчанию: 


#Аейпе В1апксһеск (а) {1пе ауа1 = (#а[0]=='\0') ? 2 : (а+0); \ 
ргіпёё ("Как я понимаю, вы имели в виду%1.\п", ауа1); \ 

} 

// Использование: 

В1апксћһеск (0); // ауа1 будет присвоено значение 0. 

В1апксһеск( ); // ауа1 будет присвоено значение 2. 


Проверочные макросы 


Устройства, способные исполнять написанные на С программы, весьма разно- 
образны, среди них и ПК под управлением 1іпих, и микроконтроллеры Агито, 
и холодильники Дженерал Электрик. Программа определяет возможности ком- 
пилятора и целевой платформы с помощью проверочных макросов, которые мож- 
но определить с помощью флага компилятора -р или во включаемых директивой 
#іпс1џде файлах, описывающих локальную функциональность, например 1154.1 
в РОЅІХ -совместимых системах или міпӣонѕ.ћ (и включаемых в него заголовках) 
в МіпаӢом. 

Понимая, какие макросы что проверяют, мы можем использовать препроцессор 
для адаптации к окружению. 

ССС и сапе выводят список определенных макросов при запуске с флагами 
-Е -0М (-Е — запускать только препроцессор, -0М – распечатывать значения макро- 
сов). На машине, которой я пользуюсь для написания этой книги, команда 


есһо "" | с1апд -амМ -Е -хс - 


выводит 157 макросов. 

Невозможно включить в книгу полный перечень всех макросов проверки воз- 
можностей, включая оборудование, версию стандартной библиотеки С и компи- 
лятора, но ниже приведены некоторые наиболее употребительные и стабильные 
макросы с пояснениями. Я выбрал те макросы, которые в наибольшей степени со- 
ответствуют теме книги или опрашивают наиболее общие аспекты системы. Име- 
на, начинающиеся с_ 5Т70С .., определены в стандарте С. 


' О допустимости пустых аргументов макроса см. С99 и С11$6.10.3(4), где явно разрешены 
«аргумситы, пе содержащие ни одной лексемы препроцессора». 
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| Макрос Назначение | 


_РОЅІХ С 5О0КСЕ Согласована со стандартом ІЕЕЕ 1003.1 (он же 1ЗОЛЕС 9945). Значением 
обычно является дата редакции 

_МІМрОИЅ Операционная система Мпаомѕ, в которой есть заголовок ніпіонз.ћ, 
содержащий все определения 

_ МАСО$Х Операционная система Мас ОЗ Х 

__ $Т0С_НОЗТЕВ _ Программа компилируется для компьютера, операционная система 
которого вызывает функцию па!п 

_ $ТОС ТЕС_559 _ Согласована со стандартом ІЕЕЕ 754, описывающим представление 


чисел с плавающей точкой. Впоследствии стандарт получил название 
1ЗОЛЕСЛЕЕЕ 60559. В частности, процессор умеет представлять Мак, 
ІМЕІМІТҮ и -ІМЕІМІТҮ 


__5ТЮС МЕКЅІОМ__ Версия стандарта, реализованная компилятором: часто 1994091. 
обозначает С89 (с исправлениями в редакции 1995 года), 1999011 - С99, 
201112 - С11 


__$Т0С_М№_АТОМТС$ _ | Равно 1, если реализация не поддерживает типа Аѓопіси не содержит 
файла ѕ{даёопіс.ћ 


| 50С МО СОМРІЕХ _ Равно 1, если реализация не поддерживает типа комплексных чисел | 
| 570С № МА _ Равно 1, если реализация не поддерживает массивов переменной длины | 


__5Т0С № ТНВЕАО$ _ [равно 1, если реализация не поддерживает описанного в стандарте С 
заголовка {ћгеайѕ.ћ и определенных в нем элементов. В качестве альтер- 
натив можно использовать потоки РОЅІХ, библиотеку ОрепМР ит. д. 


Одно из важнейших достоинств Аиѓосопѓ – умение генерировать макросы, опи- 
сывающие набор имеющихся возможностей. Предположим, что вы пользуетесь 
Аитосопф что файл сопіід.ас содержит такую строку: 


АС СНЕСК ЕОМС5 ([5ігсаѕестр азргіпе#]) 


и что в системе, в которой был запущен скрипт ./сопйдиге, имеется (описанная 
в РОЅІХ) функция ѕЁгсаѕеспр, но отсутствует (описанная в стандарте СМО /В$О) 
функция аѕргіпїЕ. Тогда Амбосоп{ создаст заголовок сопіід.ћ, содержащий такие 
строки: 

#Чейпе НАМЕ ЅТЕСАЅЕСМР 1 

/* фапаеЕ НАМЕ АЅРВІМТЕ */ 


После этого вы можете адаптировать свой код к реалиям с помощью директив пре- 
процессора #1{9еЁ (если определено) или #іѓпіеѓ (если не определено), например: 


#1пс1аае "сопід.һ" 


#1 ЕпаеЕЁ НАУЕ _АЗРЕТМТЕ 
[вставить сюда исходный код аѕргіпі/, см. пример 9.3] 
#епаіғ 


Бывает и так, что без определенной функциональности программа просто ис 
может работать, и тогда можно воспользоваться директивой препроцессора #еггог: 


#1 ЕпаеЕЁ НАУЕ_АЗРЕТМТЕ 
#еггог "НАУЕ_АЗРЕТМТЕ не определена. Ну не буду я " \ 
"компилироваться в системе без аѕргіпеї." 

#епаі Е 
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Начиная со стандарта С11, определено ключевое слово _5*а{1с_аззеге. Стати- 
ческое утверждение принимает два аргумента: подлежащее проверке статическое 
выражение и сообщение пользователю. В совместимом с С11 заголовке аѕѕегі.ћ 
определен не столь уродливо выглядящий макрос ѕќаїіс аѕѕегї, который расши- 
ряется в Ѕаїіс аззеге (С11 $7.2(3)). Например: 


#іпс1џае <1ітібѕ.һ> //ІМТ МАХ 
#1пс14е <аѕѕегё.һ> 


_Ѕбаёіс аззеге (ІМТ МАХ < 330001, "Ваш компилятор определяет слишком короткий тип іпі."); 


#1 ЕпаеЕ НАМЕ _АЗРЕТМТЕ 
ѕбабіс аѕѕегі (0, "НАМЕ АЅРКІМТЕ не определена. Не буду я " 
"компилироваться в системе без аѕргіпёЁ."); 
#епа1 Е 


Буква 1 в конце 330001 и некоторых комбинаций года и месяца означает, что эти 
числа следует рассматривать как [оп8 іп — на случай, если используется компиля- 
тор, в котором такие большие целые числа вызывают переполнение іпі. 

Такая форма удобнее, чем #і#/#еггог/#епіії, но поскольку она появилась 
лишь в стандарте, опубликованном в декабре 2011 года, то сама по себе являет- 
ся не вполне переносимой. Например, авторы Уіѕиа! 5410 реализовали макрос 
_ЭТАТТС АЅЅЕКТ всего с одним аргументом (само утверждение) и не поддерживают 
стандартного ключевого слова _З{а{1с аѕѕегі'. 

Кроме того, комбинация #1Е4еЁ/феггог/#епа1{ и ключевое слово 5&аііс аѕѕегі 
в значительной степени эквивалентны: согласно стандарту С, оба проверяют конс- 
тантные-выражения и печатают строковый-литерал, хотя первая делает это на 
этапе препроцессирования, а вторая – на этапе компиляции (С99 $6.10.1(2) и С11 
$6.10.1(3); С11 $6.7.10). Таким образом, на данный момент для проверки отсут- 
ствующей функциональности, пожалуй, безопаснее придерживаться директив 
препроцессора. 


Защита заголовков 


Что произойдет, если включить в файл два одинаковых ќуредеРа для одной и той 
же структуры? Например, что, если в заголовке Веадег . В будут такие определения: 
сурейе# ѕЕгисё { 

іпе а; 

аоџр1е Ы; 
} ар $; 


сурейе# зегис® { 
іп а; 
аоџЬ1е Ы; 
р ар з; 
Человек легко убедится, что эти структуры одинаковы, но компилятор обязан 
считать любое новое объявление структуры в файле новым типом (С99 $6.7.2.1(7) 


' Бер: //тѕап.тісгоѕоѓс.сот /еп-иѕ/ібгагу/ЬЬ918086.аѕрх. 
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и С11 $6.7.2.1(8)). Поэтому приведенный выше код не откомпилируется, так как 
символ а $ объявлен дважды и обозначает два разных (хотя и совпадающих) 
типа!. 

Получить такую же ошибку из-за двойного объявления можно, если опреде- 
лить урейеЁ только один раз, но включить содержащий его заголовок дважды: 


#1іпс1џае "ћеаЯйег.һ" 
#іпс1џае "ћеайег.һ" 


Поскольку включаемые файлы зачастую включают другие файлы, а те – третьи 
ит. д., то такая ошибка может проявиться неожиданным образом из-за длинных 
цепочек включения. Совместимое со стандартом С решение, предотвращающее 
такое развитие событий, обычно называется защитой включения (іпсІийе риага) и 
сводится к определению ассоциированного с файлом символа, наличие которого 
проверяется в директиве #1Ёпіеѓ: 

#1Еп4еЁ А1геаду іпсіџоаеа һеаа һ 
#Аейпе А1 геаау ілс1џоӣеа ћеаа һ 1 


[поместить сюда все содержимое һеайегћ] 
#епаіғ 


При первом включении файла символ еще не определен и содержимое файла 
разбирается; при втором включении символ определен, поэтому содержимое фай- 
ла пропускается. 

Этот прием используется с незапамятных времен (см. К&К, 2-е издание, 
$4.11.3), но с появлением прагмы опсе он стал немного проще. В начало файла, 
который должен включаться только один раз, помещается строка: 


#”ргадта опсе 


и компилятор понимает, что второй раз включать файл не нужно. Прагмы - меха- 
низм, специфичный для каждого компилятора, и в стандарте С определены лишь 
немногие. Однако прагму #ргадта опсе поддерживают все основные компиляторы, 
включая сс, сІапе, [п(е|, У1зца| Ѕіџіо в режиме С89 и ряд других. 


Комментирование кода средствами препроцессора 


Блок, помещенный между директивами #11 0 и #епӣі, игнорируется, и, значит, этот при- 
ем можно использовать, чтобы закомментировать большой участок кода. В отличие от 
/* ..*/, такие комментарии могут быть вложенными: 


НЕО 


НЕО 
/* код, который уже игнорируется */ 
#епаі ғ 


#епаі ғ 
' Если типы одинаковы, то повторяющиеся ќурейеРы – не проблема, потому что в соот- 
ветствии с С11 $6.7(3) «имя псевдонима типа может быть повторно определено для обо- 


значения того же типа, которое уже обозначает, при условии что этот тип ие являстся 
модифицируемым переменной». 
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Но если вложенность некорректна, например: 


НЕО 
#1 ЕаеЕ Тһіѕ 1іпе һаѕ по таёсһіпд епаіғ 
Ғепаі ғ 


то возникнет ошибка, потому что препроцессор сопоставит #епд1 Ё не с тем #1. 


Компоновка с ключевыми словами ѕЅќаіс и ехќегп 


В этом разделе мы напишем код, который будет сообщать компилятору, что тот 
должен сказать компоновщику. Компилятор обрабатывает по одному с-файлу за 
раз и (обычно) порождает один о-файл. После этого компоновщик связывает все 
о-файлы вместе, создавая библиотеку или исполняемый файл. 

Что случится, если в двух разных файлах встретятся объявления одной и той же 
переменной 2? Быть может, автор одного файла не знал, что автор другого уже вы- 
брал имя х, так что на самом деле эти две х должны были бы находиться в разных 
пространствах имен? А быть может, оба автора прекрасно знали, что ссылаются на 
одну и ту же переменную, и компоновщик должен сделать так, чтобы все ссылки 
на х вели на одну и ту же область памяти. 

Под внешней компоновкой понимается, что одинаковые символы, определен- 
ные в разных файлах, должны рассматриваться компоновщиком как один символ. 
Для обозначения внешней компоновки применяется ключевое слово ех(егп (см. 
ниже)‘. 

Говоря о внутренней компоновке, имеют в виду, что экземпляр переменной х или 
функции Е() в некотором файле принадлежит этому файлу и может быть отож- 
дествлен только с другими экземплярами х или #() в той же области видимости 
(что для объектов, объявленных вне функции, означает область видимость фай- 
ла). Для обозначения внешней компоновки применяется ключевое слово ѕіаїіс. 

Любопытно, что для внешней компоновки есть ключевое слово ех(егп, а для 
внутренней применяется не іпѓегп, чего следовало бы ожидать, а зва{1с. В разде- 
ле «Автоматическая, статическая и динамическая память» выше я рассказывал 
о трех видах памяти. Использование одного и того же слова ѕѓаїіс для описания 
компоновки и модели памяти объединяет эти концепции, которые когда-то по 
техническим причинам действительно в какой-то мере перекрывались, но теперь 
совершенно независимы. 

О Для переменных в области видимости файла слово ѕѓаѓіс влияет только на 

компоновку: 
— по умолчанию подразумевается внешняя компоновка, поэтому для изме- 
нения ее на внутреннюю нужно добавить ключевое слово ѕіаѓіс; 


Это идет от стандарта С99 и С11 $6.2.3, где на самом деле говорится о разрешении сим- 
волов в разных областях видимости, а не только в разных файлах. Но безумные трюки 
с компоновкой через границы областей видимости в пределах одного файла обычно не 
применяются. 
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— для любой переменной в области видимости файла применяется статиче- 
ская модель памяти вне зависимости от того, написано ${а{1с ілі х, ехіегп 
іпё х или просто ілі х. 

О Для переменных в области видимости блока слово ѕѓабіс влияет только на 

модель памяти: 

— по умолчанию подразумевается внутренняя компоновка, поэтому ключе- 
вое слово ѕіаїіс на компоновку не влияет. Компоновку можно изменить, 
добавив в объявление переменной слово ехїегп, но так делают редко; 

— по умолчанию модель памяти автоматическая, а наличие ключевого сло- 
ва ѕќаѓіс изменяет ее на статическую. 

О Для функций слово ѕїаёіс влияет только на компоновку: 

— функции определяются только в области видимости файла (хотя &сс 
поддерживает вложенные функции как расширение). Как и в случае 
переменных в области видимости файла, по умолчанию подразумевает- 
ся внешняя компоновка, а наличие ключевого слова 5{а&1с меняет ес на 
внутреннюю; 

— путаницы с моделями памяти не возникает, потому что функции всегда 
статические, как и переменные в области видимости файла. 

Обычно, чтобы сделать функцию доступной в нескольких с-файлах, ее объявле- 
ние помещают в й-файл, а определение - в какой-нибудь один с-файл (где у нее по 
умолчанию будет внешняя компоновка). Это разумное соглашение, которого сто- 
ит придерживаться, но довольно часто авторы хотят поместить служебные функ- 
ции из одной-двух строк (типа пах или піп) в й-файл, который включается всюду. 
Так можно сделать, предварив объявление функции ключевым словом з*а{1с, на- 
пример: 

// В файле соттоп _Ёпз.һ: 

зрае1с 1опа ЧочЬ1е тах (1опд Яоџр1е а, 1Іоп9д Яоџр1е ЬЫ) { 
(а> Ь) ?а:Ь; 

} 


Если директива #1пс]4е "соттоп Ёпѕ.ћ" встречается в десятке файлов, то в каж- 
дом из них компилятор создаст отдельный экземпляр функции пах. Но поскольку 
у этой функции внутренняя компоновка, ни один из файлов не сделает имя пах 
видимым извне, так что все эти экземпляры останутся независимыми и не будут 
конфликтовать друг с другом. Такое повторное объявление немного увеличивает 
размер исполняемого файла и время компиляции, но в типичном современном 
окружении это несущественно. 


Переменные с внешней компоновкой в файлах-заголовках 


С ключевым словом ехѓегп возникает меньше недоразумений, чем со ѕіаѓіс, по- 
тому что оно относится только к компоновке, а не к модели памяти. Типичный 
способ использования переменной с внешней компоновкой выглядит так. 
О Взаголовке, который будет включаться всюду, где переменная используется, 
объявляем переменную с ключевым словом ех(егп, например ехїегп іпї х. 
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О Ровно в одном с-файле объявляем переменную как обычно, с необязатель- 
ным инициализатором, например іп х=3. Как всегда для переменных со 
статической моделью памяти, если опустить начальное значение (написав 
просто іле х), переменная будет инициализирована значением 0 или №. 

И это все, что необходимо сделать, чтобы переменная имела внешнюю компо- 
новку. 

Может возникнуть искушение поместить объявление со словом ех(егп не в за- 
головок, а прямо в файл с кодом. Допустим, в файле /е7.с вы объявили перемен- 
ную ілі х, затем поняли, что к ней нужен доступ из /е2.с, поэтому, чтобы долго 
пе возиться, добавили строку ехѓегп 114 х в начало этого файла. Это сработает – 
сегодня. Но через месяц вы изменили объявление в /Йе1.с на ЧоцЫ]е х, и механизм 
проверки типов компилятора не будет иметь никаких возражений против /1е2.с. 
Компоновщик, оставаясь в блаженном неведении, адресует функцию в /е2.с в об- 
ласть памяти, где хранится переменная х типа 90161е, и функция радостно прочтет 
это значение как ілі. Катастрофа! Но ее можно избежать, поместив все объявле- 
ния с ключевым словом ехіегп в заголовок, который включается в оба файла – 
Је1.с и /е2.с. Если хотя бы в одном из них тип изменится, то компилятор сможет 
обнаружить рассогласование. 

Под капотом система должна многое сделать, чтобы можно было объявлять 
одну и ту же переменную несколько раз, а выделять под нее память однократно. 
Формально объявление с ключевым словом ехіегп считается объявлением (пред- 
ложением с информацией о типе, которую компилятор проверяет для обеспе- 
чения гарантированной согласованности), а не определением (инструкцией по 
выделению и инициализации памяти). Однако объявление без ключевого слова 
ехіегп считается предварительным определением: если компилятор дойдет до кон- 
ца единицы компиляции (см. ниже) и не увидит определения, то предварительное 
определение становится настоящим, с обычной инициализацией нулем или №И. 
Стандарт определяет единицу компиляции как один файл после подстановки со- 
держимого всех включаемых файлов (см. С99 и С11 $6.9.2(2)). 

Такие компиляторы, как 5сс и Сапр, обычно понимают под единицей всю про- 
грамму, считая, что программа, в которой есть несколько объявлений без ех{егп 
и нет определений, сворачивает все предварительные определения в единствен- 
ное настоящее. Даже при задании флага --рейапііс сс не обращает внимания на 
то, используется ключевое слово ехїегп или опущено. На практике это означает, 
что слово ехѓегп в значительной степени факультативно: компилятор интерпре- 
тирует десяток объявлений вида іле х=3 как одно объявление одной переменной 
с внешней компоновкой. Строго говоря, это противоречит стандарту, но в книге 
К&К (2-е издание, стр. 227] такое поведение описывается как «обычное в систе- 
мах ОМІХ и рассматриваемое как общепринятое расширение стандарта [АМЗ[ |». 
В книге | НагЫ5оп 1991] 54.8 документированы четыре различные интерпретации 
правил, касающихся ехѓегп. 

Это означает, что если вы хотели, чтобы две одноименные переменные в двух 
разных файлах считались различными, но не добавили ключевое слово зва{1с, то 
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компилятор может объединить обе переменные в одну переменную с внешней 
компоновкой, что повлечет за собой тонкие и трудноуловимые ошибки. Поэтому 
не забывайте включать ѕќаїіс в объявления переменных с областью видимости 
файла, которые должны иметь внутреннюю компоновку. 


Ключевое слово сопѕі 


Ключевое слово сопз{ невероятно полезно, но связанные с ним правила таят в себе 
ряд неожиданностей и несогласованностей. В этом разделе мы расскажем о них, 
чтобы устранить все сюрпризы и облегчить использование сопз{ в тех случаях, 
когда этого требуют правила хорошего тона. 

Еще только начиная программировать, мы узнаем, что функциям передаются 
копии входных параметров, однако функция тем не менее может изменить входные 
данные, если передать ей копию указателя на эти данные. Видя, что на вход подает- 
ся не указатель, мы сразу можем сказать, что оригинальная переменная не изменит- 
ся. Если же мы видим указатель, то ситуация неопределенная. Списки и строки по 
сути своей являются указателями, так что, возможно, переданный указатель – знак 
того, что данные могут модифицироваться, а возможно - просто строка. 

Ключевое слово сопз{ позволяет автору сделать код более понятным. Этот ква- 
лификатор типа показывает, что данные, на которые ведет параметр-указатель, 
не будут изменены внутри функции. Знать о том, что данные не изменятся, весьма 
полезно, поэтому всюду, где необходимо, пользуйтесь этим ключевым словом. 

А вот и первый подвох: компилятор не защищает данные, на которые ведет ука- 
затель, от любых модификаций. Данные, помеченные квалификатором сопз{ под 
одним именем, можно модифицировать по другому имени. В примере 8.4 перемен- 
ныеаи Ь указывают на одни и те же данные, но поскольку у а в заголовке функции 
сек еІтё нет квалификатора сопз*, то с ее помощью можно изменить любой эле- 
мент массива № (см. рис. 8.1). 


Пример 8.4 < Данные, помеченные квалификатором сопѕї под одним именем, 
можно модифицировать с помощью другого имени (сопѕїсһапде.с) 
уоіа ѕеё еті (іпё *а, іле сопѕё *Ъ) { 
а[0] = 3; 
} 


іп таіп() { 
іпё а[10] = {}; о 
іпё сопѕё *Ь = а; 
ѕеї еітї (а, Б); 

} ө 


© Инициализировать массив нулями. 
Ө Эта программа ничего не делает, важно лишь, чтобы она откомпилировалась и 
выполнилась без ошибок. Если вы хотите убедиться, что элемент [0] действи- 


тельно изменился, запустите ее под отладчиком, остановитесь на последней 
строке и напечатайте значение р. 
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іл *а 
НИНЕ Данные 
116 сопѕё *Ь 


Рис. 8.1 < Мы можем модифицировать данные через а, 
хотя р имеет квалификатор сопзі; это допустимо 


Итак, сопѕї — это лишь помощь читателю, а не реальный замок, повешенный на 
данные. 


Форма существительное-прилагательное 


Объявления следует читать справа налево. Таким образом: 
116 сопѕі – константное целое; 
11 сопѕі * — (неконстантный) указатель на константное целое; 
іп * сопѕё — константный указатель на (неконстантное) целое; 
іп * сопѕё * – указатель на константный указатель на целое; 
11% сопѕї * * — указатель на указатель на константное целое; 
116 сопѕі * сопѕі * — указатель на константный указатель на константное 
целое. 

Как видите, квалификатор сопѕі всегда относится к тому, что находится слева 
от него, – каки *. 

Можно переставить местами имя типа и сопз*, то есть іпі сопѕї и сопзі іп — одно 
и то же (хотя проделать этот фокус с сопѕї и * не удастся). Я предпочитаю форму 
ілі сопѕі, потому что она согласуется с более сложными конструкциями и прави- 
лом чтения справа налево. Но чаще встречается форма сопѕї іле, быть может, по- 
тому что ее проще произнести на обычном языке (константное целое) или потому 
что так «всегда делали». Так или иначе, годятся оба варианта. 


оооооо 


Как насчет геѕігісї и іпііпе? 


Я написал несколько тестов, в которых ключевые слова геѕігісї и іпІіпе используются 
и не используются, – просто чтобы продемонстрировать разницу в быстродействии. 
Я очень надеялся, что использование геѕігісі в числовых расчетах сможет дать реаль- 
ный выигрыш, и прошлый опыт это подтверждал. Но, написав недавно эти тесты, я об- 
наружил, что разница во времени работы пренебрежимо мала. 

Следуя собственным рекомендациям, я задавал флаги компиляции СЕЬАб5=-9 -Ма11 -03, 
а это означает, что асс применял к моим тестовым программам все известные емупри- 
емы оптимизации, и, в частности, понимал, когда трактовать указатели так, будто они 
объявлены с квалификатором геѕігісі, и когда встраивать функции. А мои указания 
были ему не нужны. 


Конфликты 


На практике иногда встречаются ситуации, когда использование сопѕї создает 
конфликты, требующие разрешения. Так бывает, если вы объявили некий указа- 
тель константным, но должны передать его функции, в которой соответствующий 
параметр не помечен квалификатором сопз*. Быть может, автор функции считал, 
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что это ключевое слово несет с собой слишком много проблем, или поверил бол- 
товне о том, что чем код короче, тем он лучше, а может, просто. забыл. 

Прежде чем что-то делать, спросите себя, может ли случиться так, что указатель 
изменится в вызываемой функции без сопѕї. Возможно, имеется редкий случай, 
когда что-то изменяется, или есть еще какая-то странная причина. Об этом в лю- 
бом случае следует знать. 

Если вы убедились, что функция не нарушает обещания константности вашего 
указателя, то можно без опаски смошенничать и привести константный указатель 
к типу неконстантного, чтобы заставить компилятор замолчать. 

// В заголовке этой функции нет сопзЕ 
уоіа ѕеё ете (11 *а, іп *Ъ) { 

а[0] = 3; 

} 


1106 таіп() { 
116 а[10); 
116 сопзЕ * = а; 
зек еіті (а, (іпе*)Ь); //...поэтому при вызове приводим тип 


Мне это правило кажется разумным. Мы можем отменить проверку констант- 
ности, осуществляемую компилятором, при условии что явно заявим о своих на- 
мерениях. 

Если вы не уверены, что вызываемая функция с уважением отнесется к дан- 
ному вами обещанию константности, то можете пойти дальше и сделать копию 
данных, не ограничившись созданием псевдонима. Поскольку вы в любом случае 
не собирались изменять данных, то после возврата из функции копию можно бу- 
дет выбросить. 


Глубина 


Допустим, имеется структура – назовем ее соипеег_5 – и функция, которая прини- 
мает указатель на эту структуру: Ё (соџпіег ѕ сопз{ *іп). Может ли такая функция 
изменять элементы структуры? 

Давайте проверим. В примере 8.5 создана структура, содержащая два указателя. 
Константный указатель на эту структуру передается функции га{10, а затем один 
из хранящихся в ней указателей мы передаем другой функции, в которой пара- 
метр не объявлен как сопзі, и компилятор при этом не ругается. 


Пример 8.5 * Элементы константной структуры не являются константными 
(сопѕіѕігисї.с) 


#1пс1и4е <аѕѕегі.һ> 
#іпс10џдӢе <51а1ір.һ> //аѕѕегё 


фуредеЕ ѕёгосі { 
іпё *соцпіег1, *соипеег2; 


} соџпёег 5; 


уоіа спеск_соипеег (іп *сЄг) { аѕѕегё (*сёг !=0); } 
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дӢоџр1е гаїіо (соипеег_$ сопѕё *іп) { © 
сһеск соџпѓег (іп->соџпёег2); 
геіџгп *іп->соџпёег1/ (*іп->соџпёег2+0.0); 2, 
} 
іпЕ таіп() { 
соџпёег 5 сс = {.соцпіег1=та110с (5і2еоЁ (іпё)), © 


.соцпбег2=та11ос (ѕігеоЁ (іпё)) }; 
*сс.соцпіег1 = *сс.сооџпёег2 = 1; 
габіо (&сс); 


} 


© Входная структура помечена квалификатором сопѕї. 

Ө Передаем элемент константной структуры функции, принимающей некон- 
стантный параметр. Компилятор не ругается. 

© Здесь используются позиционные инициализаторы - о них чуть позже. 


В определении структуры можно снабдить элемент квалификатором сопѕї, хотя 
обычно это лишнее. Если действительно необходимо защитить только самый ниж- 
ний уровень в иерархии типов, то лучше оговорить это в документации. 


Проблема сһаг сопѕї ** 


В примере 8.6 приведена простая программа, которая проверяет, задано ли 
в командной строке имя пользователя [55у Рор. Вот какэта программа вызывает- 
ся из оболочки (напомним, что переменная $? содержит значение, возвращенное 
последней запущенной программой): 


ідду рор дебесіог Ідду Рор; есһо $? # печатается 1 
ідду рор деёесіог Сһаіт Меіб2; есһо $? # печатается 0 


Пример 8.6 * Неоднозначные формулировки в стандарте вызывают 
разнообразные проблемы при интерпретации указателя на указатель на константу 
(іду рор _аеїесїог.с) 

#іпс1џаде <ѕёароо1.һ> 

#1пс1и4е <ѕігіпдѕ.һ> //зЕгсазестр (из РОЅІХ) 


роо1 сһеск пате (сһаг сопѕё **1п) { © 
геёогп (! ѕёгсаѕестр (іп[0], "1дду") && !ѕёгсаѕестр (1п[1], "Рор")) 
|| (!з6гсазеспр (іп[0], "Јатеѕ") && !з&гсазеспр (1п[1], "Оѕёегрегд")); 


} 


іп ма1п(1пе агдс, сһаг **агду) { 
іЁ (агас < 2) гебогп 0; 
гебигп сһеск пате (&агду([1]); 
} 


© Если вы раньше не сталкивались с булевым типом, читайте врезку ниже. 


Функция сћһеск папе принимает указатель на строку, он константный, потому 
что изменять входные строки нет необходимости. Однако компилятор выдает 
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предупреждение. В случае СІапе оно звучит так: «раѕѕіпе сћаг ** ќо рагатеѓег оѓ 
буре сопѕі сћаг ** 415саг4$ дџа[ібегѕ іп пезе4 роіпѓег ёуреѕ» (передача сћаг ** в ка- 
честве параметра типа сопѕї сћаг ** приводит к игнорированию квалификаторов во 
вложенных указательных типах). Имея дело с последовательностью указателей, 
все компиляторы, к которым у меня был доступ, преобразуют в сопѕї то, что можно 
было бы назвать указателем верхнего уровня (приводят к типу сћаг * сопзі *), но 
ругаются, если попросить их сделать константным объект, на который указатель 
указывает (сһаг сопѕї **, он же сопзі сваг **). 

Придется выполнить приведение типа явно – заменить сһеск папе (ќаду [1]) на: 


сһеск пате ( (сһаг сопѕё**) &агау[1]); 


Почему это вполне разумное приведение нельзя было выполнить автоматиче- 
ски? Чтобы увидеть, в чем проблема, придется создать нетривиальные условия, 
а вся история не согласуется с изложенными ранее правилами. Поэтому объясне- 
ние будет непростым, и я не стану осуждать тех, кто захочет его пропустить. 

В примере 8.7 создаются три ссылки, показанные на диаграмме: прямая ссылка 
сопѕіріг -> Нхед и непрямая ссылка, состоящая из двух шагов: сопѕїріг -> чаги чаг 
-> Нхе4. Два присваивания в коде производятся явно: сопѕіріг -> чаг и сопѕіріг -> -> 
хед. Но поскольку *сопѕіріг == таг, то второе присваивание неявно создает ссылку 
уаг -> Вхед. Когда мы выполняем присваивание *\аг=30, переменная йхе4 получает 
значение 30. 


Пример 8.7 * Мы можем модифицировать данные по альтернативному имени, 
хотя по основному имени они константны - это должно быть недопустимо 
(соп$Низюп.с) 


#1пс104е <3Е41о.1> 


116 ма1п() { 
іп *уаг; 
іпе сопзЕ **сопѕірёг = &\уаг; // эта строка - предпосылка ошибки 
іп сопзё Йхеа = 20; 
*сопзёріг = &іхеа; // абсолютно законно 
*уаг = 30; 
ргіпёЁ ("х=%1 у=%1\п", йхеа, *уаг); 


11% *уаг 


11% сопѕё 11% сопѕё 
*сопѕіріг Вхед 


Мы никогда не смогли бы разрешить переменной іпі *уаг прямо указывать на 
116 сопз{ йхеа. Это удалось сделать только с помощью хитрой уловки – таг неявно 
указывает на хей, а открыто об этом нигде не сказано. 
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Ваша очередь. Можно ли вызвать такую же ошибку с сопѕї, когда запрещенное приве- 
дение типа происходит в результате вызова функции, как в показанной выше программе 
распознавания Игги Попа? 


Как и раньше, данные, помеченные квалификатором сопз* под одним именем, 
удается изменить с помощью другого имени. Поэтому не должен вызывать удив- 
ления тот факт, что мы сумели изменить константные данные, воспользовавшись 
альтернативным именем‘. 

Я перечисляю проблемы, касающиеся сопзі, чтобы вы знали, как их преодолеть. 
Но в реальности все не так ужасно, и совет включать сопѕї в объявления функций 
всюду, гдеэто уместно, остается в силе – только не ворчите, что ваши предшествен- 
ники писали заголовки неправильно. Ведь рано или поздно кто-то воспользуется 
вашим кодом, и вряд ли вам понравится их ворчание – мол, мы не можем восполь- 
зоваться ключевым словом сопзі, потому что он неправильно объявил функции. 


Истина и ложь 


Изначально в С не было булева типа, принимающего значения {гие и їаіѕе, а вместо него 
действовало соглашение: все, что равно нулю или МИЦ, – ложь, все остальное - истина. 
Таким образом, условия ії (ріг! =№0Ш) и ії (ріг) эквивалентны. 


В стандарте С99 был введен тип Воо], хотя технически он необязателен, так как 
всегда можно представить значения (гие и ѓа[ѕе целым числом. Но для человека, 
читающего код, булев тип является прямым указанием на то, что переменная мо- 
жет принимать только значения (гие или ѓа[ѕе, то есть проясняет намерения автора. 

Комитет по стандартизации остановился на имени Воо], поскольку оно попа- 
дает в пространство имен, зарезервированных для самого языка, но, конечно, вы- 
глядит оно ужасно. В заголовке 54600[.й определены три макроса для удобства 
чтения: роо] расширяется в Воо], поэтому вам не придется использовать в объяв- 
лениях такой неприглядный подчерк; {гие расширяется в 1, а ѓа1$е - в 0. 

Как и тип 001, макросы ѓгие и #а15е проясняют природу присваивания: если я 
забуду объявить оцёсопе как роо], то выражение оцёсоме= гие напомнит о моем на- 
мерении, а оцёсопе=1 - нет. 

Однако нет никаких фундаментальных причин сравнивать выражение с {гие 
или Ёа1зе: все мы привыкли, что ії (х) означает если х истинно, то.., и явное добав- 
ление части == гие излишне. Кроме того, если в программе есть х=2, то 1+ (х) делает 
то, что все ожидают, тогда как 1# (х==їгџе) – нет. 


' Приведенный здесь код заимствован из примера в стандартах С99 и С11 $6.5.16.1(6), 
в котором строка, аналогичная сопз(рёг= &уаг, названа нарушением ограничения. Почему 
же рсс и СІапе выдают в этом случае предупреждение, но не прекращают компиляцию? 
Потому что технически все правильно: в разделе С99 и С11 $6.3.2.3(2), относящемся кта- 
ким квалификаторам типа, как соп$ё, приводится объяснение: «Для любого квалифика- 
тора 4 указатель па тип без квалификатора 4 может быть преобразован в указатель на тот 
же тин с квалификатором 4...». 
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Текст 


Я верю в то, что слово в итоге разрушит 
бетон. 


— Риѕѕу К1оё цитата из Солженицына 
в речи от 8 августа 2012 г. 


Составленная из букв строка – это массив неопределенной длины, а размер ав- 
томатически выделенного в стеке массива нельзя изменить, и в этом корень всех 
проблем с текстом в С. По счастью, многие до нас уже сталкивались с этой пробле- 
мой и предложили решения - пусть даже неполные. Горстки определенных в стан- 
дартах Си РОЗ[Х функций достаточно для удовлетворения многих потребностей, 
возникающих при работе со строками. 

Кроме того, язык С проектировался в 1970-х годах, когда вопрос о языках, от- 
личных от английского, еще не ставился. Но при использовании правильных 
функций (и правильного понимания принципов кодирования языка) изначальная 
приверженность С английскому перестает быть проблемой. 


Безболезненная обработка строк с помошью 
аѕргіпіғ 


Функция аѕргіпё# выделяет для строки столько памяти, сколько нужно, а затем 
заполняет ее. Это означает, что вам думать о выделении памяти для строк больше 
не нужно. 

аѕргіпёё не описана в стандарте С, но имеется в системах, где установлена 
стандартная библиотека СМО или ВЅр, а это подавляющее большинство поль- 
зователей. К тому же библиотека СМО ГЛЫБегбу содержит версию азрг1п( Е, кото- 
рую можно либо скопировать в свой код, либо вызывать из библиотеки, добавив 
флаг компоновщика -1егу. Библиотека ГЛЫБегеу входит в состав дистрибу- 
тива некоторых систем без встроенной поддержки аѕргіпёѓ, в частности М$У$ 
для УЛп4о\. А если копирование исходного кода из 1ірірегіу вас почему-то не 
устраивает, то ниже приведена простая реализация на базе стандартной функции 
уѕпргіпіЁ. 

Старый способ работы провоцировал программистов на убийство (или на са- 
моубийство – в зависимости от темперамента), поскольку нужно было сначала 
вычислить длину новой строки, затем выделить для нее память и только потом 
записать в эту память данные. И не забыть о завершающем нуле! 
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В примере 9.1 показан трудоемкий способ подготовки строки для передачи 
функции ѕуѕіеп, запускающей внешнюю программу. В качестве такой программы 
взята близкая к рассматриваемой теме утилита $11195, которая ищет в двоичном 
файле печатаемые строки. Функции де ѕігіпдѕ передается агду[0], имя самой 
программы, то есть мы ищем строки в исполняемом файле своей же программы. 
Это забавно, а чего еще требовать от демонстрационного примера? 


Пример 9.1 + Утомительный способ подготовки строк (ѕааѕїгіпд5.с) 
#іпс10џае <э&а1о.Н> 


#іпс10џде <з&г1п9.В> //зЕг1еп 
#іпс1џае <56а1ір.һ> //та11ос, Ёгее, ѕуѕіет 


уоіа де эігіпдѕ (сһаг сопзЕ *іп) { 
сһаг *спа; 
116 1еп = ѕіг1еп("ѕёгіпдѕ ") + ѕёгіеп (іп) + 1; © 
ста = та11ос (1еп); © 
зпрг1пЕЕ (ста, 1еп, "ѕгіпдѕ%ѕ", іп); 
іЁ (ѕуѕбет (ста)) Ёргіпі# (з&4егг, "что-то не так с запуском% 5. \п", ста); 
Ғгее (спа); 


} 


106 тма1п(1пе агдс, сһаг **агду) { 
де ѕегіпдѕ (агду[0]); 
} 


© Предварительное вычисление длины - такая трата времени! 
Ө В стандарте С говорится, что 312е0# (сһаг) ==1, поэтому хотя бы не нужно писать 
па] 10ос (1еп*$17е0+ (сһаг)). 


В примере 9.2 используется аѕргіпёѓ, которая сама вызывает па110с, а это озна- 
чает, что и вычисление длины строки можно опустить. 


Пример 9.2 < Эта версия всего на две строки короче приведенной в примере 9.1, 
но именно эти две строки - источник всех печалей (деїѕїігіпд5.с) 

#Аейпе _СМО_ЗО0ВСЕ //чтобы з&410.Н включал аѕргіпеѓ 

#іпс1џае <5аіо.һ> 

#іпс1џде <56а1ір.һ> //Ёгее 


уоіа деб ѕегіпдѕ (сһаг сопѕб *іп) { 
сһаг *спта; 
аѕргіпі# (&ста, "ѕгіпдѕ%ѕ", іп); 
іЁ (ѕуѕёет(ста)) ЁЕрг1пЕЁ (зЕ4егк, "что-то не так с запуском%ѕ. \п", ста); 
Ғгее (ста); 


} 


116 таіп (іп агдс, сһаг **агду) { 
де ѕегіпаѕ (агаду[0]); 
} 


Вызов аѕргіпії очень похож на вызов ѕргіпіѓ, только вместо самой строки нуж- 
но передать ее адрес, потому что область памяти для строки будет выделена с по- 
мощью па11ос, а адрес этой области записан в переданный параметр типа сћаг **. 
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Но допустим, что по какой-то причине СМИ азрг1п(Е вам недоступна. Вычис- 
ление длины области, необходимой для размещения строки и ее аргументов, - за- 
дача, при решении которой легко ошибиться. Как бы заставить компьютер сде- 
лать это за нас? За ответом далеко ходить не надо, потому что в стандартах С99 
57.19.6.12(3) и С11 $7.21.6.12(3) написано: «Функция узпрг1п( Е возвращает коли- 
чество символов, которое было бы записано, если бы п было достаточно велико, 
без учета завершающего нулевого символа, или отрицательное значение в случае 
ошибки кодировки». Функция зпрг1п{Ё также возвращает значение, «которое 
было бы...». 

Таким образом, если выполнить пробный вызов уѕпргіпіё, передав ей одно- 
байтовую строку, то в ответ мы узнаем, сколько места нужно выделить для новой 
строки. После этого мы выделяем память и вызываем уѕпргіпії по-настоящему. 
Функция работает дважды, что приводит к удвоению времени, но ради безопас- 
ности и удобства на это можно пойти. 

В примере 9.3 показана реализация азрг1п(Ё с помощью описанного подхода: 
двукратного вызова узпре1п\ Е. Я обернул ее проверкой символа НАТЕ АЅРКІМТЕ, что- 
бы можно было учесть результаты АшосопЁ см. ниже. 


Пример 9.3 * Альтернативная реализация аѕргіпії (азрип#.с) 
#1 Ғпдеѓ НАМЕ АЅРКІМТЕ 

#аеїіпе НАУЕ_АЗРЕТМТЕ 

#іпс10ае <ѕ6аіо.һ> //узпре1пЕЕ 

#іпс1џае <56а1ір.һ> //та11ос 

#іпс1џае <ѕСдагд.һ> //ма ѕбагб еб а1 


/* Объявление, нужно поместить в һ-файл. Спецификатор __аёёгіроёе сообщает 
компилятору, что нужно проверять совместимость типов в духе ргіпіё. Это 
расширение стандарта С, но большинство компиляторов его поддерживают; 

если ваш не относится к их числу, просто уберите этот спецификатор */ 

іпЕ азрг1пЕЁ (сһаг **з6г, сһаг* Ётё, ...) __абёгірибе _ ((Еогтае (ргіпе#,2,3))); 


іпё аѕргіпе Ё (сһаг **5г, сһаг* Ётё, ...) { 

уа _11іѕі агар; 

уа _збаге (агдр, Еті); 

сһаг опе сһаг[1]; 

іпЕ Іеп = уѕпргіпеЁ (опе сћаг, 1, Ёт, агдр); 

1Е (]еп < 1) { 
Ғргіпе# (56 4егг, "Ошибка кодировки. Входной указатель сброшен в МО. \п"); 
*5г = МЈ; 
геєогп 1еп; 

} 


уа_епа (агар); 


хѕіг = та11ос (1еп+1); 


іЁ (15р) { 
Ерг1пЕЁ (зе 4егг, "Не удалось выделить%1 байтов. \п", 1еп+1); 
геіогп -1; 


} 
уа _ѕіагі (агдр, Ёт); 
уѕпргіпёЁ (*56г, 1еп+1, ЕщЕ, агар); 
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уа_еп4 (агар); 
гебигп 1еп; 


} 
#епаіғ 


#1 Е4еЕ Теѕі аѕргіпіғ 

106 таіп() { 
сһаг *5; 
аѕргіпе# (65, "Һе110,%5.", "_Веааег-"); 
ргіпеЁ ("%5\п", 3); 


аѕргіпёЁ (65, "%С", '\0'); 
ргіпЁ ("пустая строка: [%$]\п", $); 


іпі і = 0; 
аѕргіпіё (65, "%1", і++); 
ргіпё# ("Нуль : %5\п", $); 


} 
#епа1 Ё 


Безопасность 


Если имеется строка фиксированной длины ѕіг и вы записываете в нее данные 
неизвестной длины с помощью зре!п(Е, то можете случайно затереть область по 
соседству с зїг – классическое нарушение безопасности. Поэтому вместо зре1пЕЕ 
рекомендуется применять функцию ѕпргіпії, которая ограничивает длину запи- 
сываемых данных. 

Использование азрг1п( устраняет эту проблему, потому что выделяется столь- 
ко памяти, чтобы все записываемые данные в нее гарантированно поместились. 
Это не дает полной гарантии: конечно, даже в специально подобранной со злым 
умыслом строке рано или поздно встретится \0, но ее длина может превысить объ- 
ем свободной памяти, или в ѕёг могут быть записаны дополнительные данные, со- 
держащие секретные сведения, например пароль. 

В случае нехватки памяти аѕргіпії вернет -1, поэтому если входные данные по- 
ступают от пользователя, осторожный программист воспользуется чем-то вроде 
макроса 5+ор1Ё (о котором я расскажу ниже в разделе «Макросы с переменным 
числом аргументов»): 


ЭЗЕор1 ЕЁ (аѕргіпе# (656г, "%5", изег_1при®)==-1, гебигп -1, "азрг1пЕЁ Ғаі1еа.") 


Впрочем, если вы зашли так далеко, что передаете аѕргіпїї непроверенную 
строку, то терять уже нечего. Заранее проверяйте, что строки из не заслуживаю- 
щих доверия источников имеют разумную длину. При этом функция может вер- 
нуть ошибку, даже когда длина строки не слишком велика, потому что память 
у компьютера закончилась или ее пожирают злые гремлины. 

В стандарте С11 (приложение К) также описаны все обычные функции форма- 
тирования с суффиксом 5: ргілёЁ 5, ѕпргіпіЁ з, Ерг1п(ЕЁ $ и т. д. Предполагается, 
что они безопаснее функций без суффикса з. Входная строка не может быть равна 
№, и при попытке записать в строку более КІМТ МАХ байтов (где КІМТ МАХ – по идее, 
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половина максимальной величины типа ѕіғе {) функция возвращает код ошибки 
«нарушено ограничение времени выполнения». Однако поддержка этих функций 
в стандартной библиотеке С пока еще оставляет желать лучшего. 


Константные строки 
Следующая программа подготавливает две строки и выводит их на экран: 


#іпс1џае <56аіо.һ> 


іп таіл () { 
сһаг *51 = "Тһгеаа"; 


сһаг *52; 
аѕргіпіё (652, "Е1055"); 


ргіпе# ("%5\п", 51); 
ргіпіЕЁ ("%5\п", 52); 


В обоих случаях строка содержит одно слово. Однако компилятор С трактует 
их совершенно по-разному, и это может застать программиста врасплох. 

Вы пробовали выполнить предыдущий пример, в котором запускалась про- 
грамма поиска строк в исполняемом файле? В данном случаеодной из таких строк 
была бы строка Тһгеай, и переменная 31 указывала бы на область в памяти самой 
программы. Вот ведь как эффективно - не надо тратить времени, заставляя си- 
стему подсчитывать символы, и расходовать память, дублируя информацию, уже 
присутствующую в исполняемом файле. Полагаю, в 1970-е годы это было важно. 

И 51, указывающая на статическую строку, и 52, указывающая на область, дина- 
мически выделенную по запросу, с точки зрения чтения, ничем не отличаются, но 
ни модифицировать, ни освободить 51 нельзя. Ниже показано, что случится, если 
добавить в программу еще несколько строк: 
52[0]='#'; // Первая буква Ғ1055 становится маленькой. 
51[0]='6'; // Нарушение защиты памяти. 


Ғгее (52); // Освобождение памяти. 
Ғгее (51); // Нарушение защиты памяти. 


В зависимости от системы 51 может указывать прямо на строку, являющуюся 
частью исполняемого файла, или на строку, скопированную в сегмент, допускаю- 
щий только чтение; на самом деле в С99 $6.4.5(6) и С11 $6.4.5(7) говорится, что 
способ хранения константных строк не специфицируется, а результат их модифи- 
кации не определен. Поскольку таким неопределенным поведением может быть — 
и часто бывает – нарушение защиты памяти, то содержимое $1 надлежит рассма- 
тривать как неизменяемое. 

Разница между константной и изменяемой строкой тонка и провоцирует ошиб- 
ки, поэтому зашитые в код строки полезны только в очень специальных контек- 
стах. Не могу представить себе скриптовый язык, в котором это различие было бы 
существенно. 


Глава 9. Текст % 197 


Однако есть одно простое решение: функция ѕігаџр (5ёит= 4ирйсайе), которая 
определена в стандарте РОЅІХ. Применяется она так: 


сһаг *53 = ѕігаџр ("Тһгеаа"); 


Строка Тћгеаа по-прежнему зашита в программу, но 53 – копия этой неизменяе- 
мой глыбы, поэтому ее уже можно модифицировать, как душа пожелает. Не стес- 
няйтесь пользоваться ѕігаџр – ивы сможете обращаться со всеми строками одина- 
ково, не думая о том, какие из них константные, а какие выделены динамически. 

Если ваша система не совместима со стандартом РОЗХ и вас беспокоит отсут- 
ствие ѕЕгаир, то совсем несложно написать ее самостоятельно. Можно, например, 
воспользоваться все той же аѕргіпіё: 

#1 ЕпаеЁ НАМЕ $ТВООР 

сһаг *5гаџр (сһаг сопѕё* іп) { 
іЁ (іп) гебагп МО; 
сһаг *оџѓ; 
аѕргіпеЁ (&00е, "%5", іп); 
геіигп ооё; 


} 
#епаіғ 


А откуда берется символ НАУЕ_5ТКОУР? Если вы пользуетесь Аиќоќооіѕ, то нали- 
чие строки 


АС_СНЕСК_РОМС$ ([азрг1пЕЁ $з6гачр]) 


в файле сопЙрите.ас породило бы в скрипте сопйдиге фрагмент, который включает 
в файл сопјівиге.ћ директивы определения или отмены определения НАТЕ ЅТКОР и 
НАУЕ АЅРКІМТЕ в зависимости от того, что обнаружено в конкретной системе. 


Расширение строк с помощью азрип 


Вот простейший пример добавления текста в существующую строку с помощью 
функции азрг1 пе: 


азрг1пЕЁ (&а, "%5 и еще фраза%ѕ", а, айате); 


Такую технику я применяю для построения запросов к базе данных. Я строю 
запрос из частей, как показано в следующем искусственном примере: 
ілі со1 питрег=3, регѕоп потрег=27; 
сһаг *а =5ѕігаиџр("ѕеіесі "); 
аѕргіпеё (69, "%5со1%і \п", а, со1 питрег); 
азргіпё (64, "%зЕгом бар \п", а); 
аѕргіпе# (&а, "%5иһеге регѕоп іа =%і", а, регѕоп попрег); 


А в конце получается: 


ѕеІесі со13 
Ғгот бар 
мћеге регѕоп іа = 27 


Это довольно удобный способ сборки длинной строки, который становится 
просто необходим по мере усложнения структуры запроса. 
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Но здесь имеет место утечка памяти, потому что область, на которую первона- 
чально указывала переменная д, не освобождается перед тем, как аѕргіпёѓ запишет 
в д адрес новой области. Если речь идет об однократном создании строки, то не 
о чем и беспокоиться — можно насоздавать, не освобождая, несколько миллионов 
таких запросов, прежде чем случится что-то, достойное внимания. 

Если же в программе может быть создано неизвестное число строк неизвестной 
длины, то следует пользоваться формой, показанной в программе 9.4. 


Пример 9.4 + Макрос, который чисто расширяет строки (ѕаѕргіпі.с) 
#іпс1џае <5Еаіо.һ> 
#іпсіџӣе <56а1ір.һ> //Егее 


// Безопасный макрос, обертывающий азрг1пЕЁ 


#Аейпе Зазре1пЕЕ (иг1 ке бо, ...) { \ 
сһаг *тр ѕгіпд Ёог ехќепа = (игібе ёо); \ 
аѕргіпіё (& (игісе ёо), __ МА АКСЅ _); \ 


Егее (ётр ѕігіпд Ёог ехіепа); \ 


// пример использования: 
іп таіп () { 
116 1=3; 
сһаг *а = МОШ; 
Зазрг1пЕ# (а, "ѕеїесі * Ёгот бар"); 
Ѕаѕргіпё# (4, "%5 мһеге со1%1 іѕ поб пи11", а, 1); 
ргіпеЁ ("%5\п", а); 


Макроса Ѕаѕргіпёї в сочетании со ѕігіор может хватить для всего, что приходит- 
ся делать со строками. Если не считать одной мелочи и необходимости время от 
времени вызывать Ёгее, то можно забыть об управлении памятью. 

Мелочь заключается в том, что если вы забудете инициализировать д – значени- 
ем МО или посредством ѕігіор, – то при первом обращении макрос Ѕаѕргілі осво- 
бодит случайную область память, на которую указывает неинициализированная 
переменная 4, – вот вам и нарушение защиты. 

Например, следующая строка закончится печально — чтобы она заработала, 
объявление нужно обернуть вызовом ѕёгӣор: 


сһаг *а = "зе1есе * Ёгот"; // ошибка - нужна ѕігаир (). 
Зазрг1пЕЁ (а, "%5%5 мһеге со1%1 1$ поб пи11", а, бар1епате, і); 


При интенсивном использовании такой способ конкатенации строк теорети- 
чески может вызвать замедление работы, поскольку первая часть строки каждый 
раз перезаписывается. В таком случае используйте С для прототипирования его 
самого: тогда и только тогда, когда описанная техника оказывается слишком 


медленной, выделите в своем графике время, чтобы заменить ее использованием 
зпре1пЕЕ. 
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Песнь о ѕЇігок 


Разбиение на лексемы – простейшая и наиболее часто встречающаяся задача разбо- 
ра текста; цель заключается в том, чтобы разбить строку на части в местах вхожде- 
ния символов-разделителей. Под это определение подходят разнообразные задачи: 
О разбиение на слова, когда в качестве разделителей выступают символы-пус- 
тышки: " \Є\л\г"; 
выделение каталогов из списка путей "/оѕг/іпс1џде: /иѕг/1оса1 /іпсіџде:.", 
в котором каталоги разделены двоеточием; 
разбиение на строчки по символу "\п"; 
разбор конфигурационного файла, состоящего из строк вида ключ= значение, 
разделителем в этом случае является знак "="; 
список разделенных запятыми значений в файле данных. 
Может быть и два уровня разбиения, например сначала конфигурационный 
файл разбивается на строки по знаку перехода на новую строку, а затем каждая 
строка разбивается на ключ и значение по знаку =. 


о оо о 


> Если стоящая перед вами задача сложнее, чем разбиение по одному символу-раздели- 
`... телю, то могут понадобиться регулярные выражения. В разделе «Разбор регулярных вы- 
ражений» на стр. 321 обсуждается использование совместимых с РОЯХ регулярных вы- 
ражений и выделение с их помощью частей строки. 


Задача о разбиении на лексемы встречается настолько часто, что в стандартной 
библиотеке С для нее есть специальная функция, ѕігїок (ѕігіпе іоКепіғе), – одна 
из скромных тружениц, которая хорошо и без лишнего шума делает свою работу. 

ѕігіок просматривает строку, пока не найдет первый разделитель, после чего 
записывает на его место '\0'. Теперь от строки осталась часть, представляющая 
первую лексему, и ѕгіок возвращает указатель на ее начало. Внутри себя функ- 
ция хранит информацию об исходной строке, поэтому при следующем вызове она 
будет искать конец следующей лексемы, заменит очередной разделитель нулем и 
вернет указатель на начало найденной лексемы. 

Начало каждой подстроки - это указатель на позицию внутри уже имеющейся 
строки, поэтому процесс разбиения сопровождается минимумом операций записи 
(только символы \0) и не требует никакого копирования. Правда, входная строка 
модифицируется, и поскольку подстроки представляют собой указатели внутрь 
исходной строки, то исходную строку нельзя освободить, пока не будет закончена 
работа с подстроками (либо можно с помощью функции $ г4ир копировать лексе- 
мы в другое место по мере их выделения). 

Функция ѕігіок хранит указатель на остаток переданной ей строки вединствен- 
ной внутренней статической переменной-указателе, а это означает, что она может 
одновременно обрабатывать только одну строку и не предназначена для работы 
в многопоточной программе. Поэтому функцию ѕЁгіок следует считать нереко- 
мендуемой. 

Вместо нее используйте функцию ѕігіок г или ѕігіок з – пригодные для много- 
поточной работы варианты ѕігїок. В стандарте РОЅІХ описана ѕігѓок г, а в стан- 
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дарте С11 — ѕігіок 5. Работать с ними не так удобно, потому что первое обращение 
отличается от всех последующих. 

О При первом обращении к функции в первом аргументе передается разби- 
раемая строка. 

О При последующих обращениях в первом аргументе персдается МОТ. 

О Последний аргумент служит для запоминания состояния. При первом об- 
ращении инициализировать его не нужно, а при последующих он будет со- 
держать уже разобранную часть строки. 

Ниже приведена функция для подсчета строк (точнее, ненустых строк; см. 
предостережение ниже). В скриптовых языках для разбиения на лексему обычно 
достаточно одной строки кода, но и наша версия, написанная с использованием 
ѕігіок г, не намного длиннее. Обратите внимание на конструкцию ії ? Шеп : е15е, 
необходимую для передачи исходной строки только при первом обращении. 


#1пс1и4е <ѕёгіпд.һ> //зЕгЕоКк_г 


ілі со0џпё 1іпеѕ (сһаг *іпѕёгіпд) { 
116 соипеег = 0; 


сһаг *ѕсгасһ, *хё, *ае1ітіёег = "\п"; 
мһі1е ((ЕхЕ = ѕЕгбок г (! соџпёег ? іпѕёгіпд : МО, деіітібег, ё&ѕсгаёсћ))) 
соцпіег++; 


геёигп соипеег; 


В разделе о кодировке Опісоде приведен полный пример, равно как и в про- 
грамме из области цетологии в разделе «Подсчет ссылок» на стр. 277. 

Функция ѕЕгЕок 5 из стандарта С11 работает так же, как ѕігіок г, но принимает 
дополнительный аргумент (второй), в котором передается длина входной строки, 
а после возврата он содержит длину оставшейся части строки. Если входная стро- 
ка не завершается нулем, то этот дополнительный аргумент будет полезен. При- 
веденный выше пример можно переписать в таком виде: 


#іпс10дӢе <ѕёгіпд.һ> //зЕгеоК_5$ 


//первое обращение 
ѕіғе і 1еп = зіг1Іеп(іпзбгіпд); 
ЕхЕ = згбок ѕ(іпѕбгіпд, &1еп, 4е11т16ег, &5сгаісһ); 


// последующие обращения: 
хе = зігбок 5 (МОГ, &1еп, ае11т1%ег, &5сгаёсћһ); 


/\ Два и более разделителей подряд рассматриваются как один разделитель, то есть пустые 

1} лексемы попросту игнорируются. Например, если разделителем является символ ":" и вы 
с помощью ѕгіок г или зігїок ѕ разбираете строку /ріп: /иѕг/ріп: : /ор/ріп, то получите 
три каталога, потому что : : рассматривается как :. Именно по этой причине показанная 
выше функция на самом деле подсчитывает непустые строки; ведь двазнака перехода на 
новую строку подряд, как, например, в случае опе \п\п Епгее \п Ёоџ (одна строчка здесь 
пустая), считаются функцией ѕігіок и ее вариантами как один. 
Игнорирование двойных разделителей - часто именно то, что нужно (как в примере со 
списком путей), но иногда это не так, и в таком случае нужно подумать, как распознавать 
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двойные разделители. Если разбиваемую строку писали вы сами, то позаботьтесь о спе- 
циальном маркередля обозначения пустых строк. Написать функцию, которая будет пред- 
варительно просматривать строку на предмет обнаружения двойных разделителей, тоже 
нетрудно (можете также воспользоваться функцией $ г5ер, описанной в стандарте В$0/ 
СМУ). Если данные поступают от пользователей, то можете повесить суровое предостере- 
жение: двойные разделители запрещаются - и предупредить о последствиях, например 
об игнорировании пустых строк при подсчете. 


В примере 9.6 представлена крохотная библиотечка строковых утилит, которые 
могутвам пригодиться, в том числе несколько уже встречавшихся ранее макросов. 

Основных функций две. Первая — $119 Ёгоп йе — читает все содержимое 
файла в одну строку. Это избавляет нас от необходимости читать и обрабаты- 
вать небольшие фрагменты файла. Если вы каждодневно работаете с тексто- 
выми файлами гигабайтного размера, то эта функция вам не понадобится, но 
в случаях, когда размер файла не превышает нескольких мегабайтов, нет смысла 
возиться с поблочным чтением. Я воспользуюсь этой функцией в нескольких 
примерах ниже. 

Вторая функция ок аггау пен разбивает строку на лексемы и помещает их 
в структуру ок аггау. В примере 9.5 показан заголовок этой библиотеки. 


Пример 9.5 + Заголовок библиотеки, содержащей несколько строковых утилит 
(ѕїгіпа_иїйіеѕ.һ) 

#1пс1а4е <ѕёгіпд.һ> 

#дебле _СМО ЅООКСЕ //аѕкѕ ѕіаіо.һ бо 1пс1и4е аѕргіпёё 

#1пс1и4е <ѕ1аіо.һ> 


// Безопасный макрос, обертывающий азрг1пЕЁ 


#Чейпе ЅаѕргіпіЁ (мгібе бо, ...) {\ © 
сһаг *тр эгіпд Ғог ехќепа = мгібе бо; \ 
аѕргіпеё (& (нгібе бо), __ УА АКбЅ _); \ 


Егее (тр эгіпд Ёог ехќепа); \ 


} 
сһаг *56г1п9_Егом Н1е (сһаг сопѕё *Н1епапе); 
суреде? зЕгисе ок аггау { 


сһаг **е1етепіѕ; 
сһаг *раѕе ѕігіпд; 


іп Іепдёһ; 
} ок аггау; ө 
ок аггау *ок_аггау пем (сһаг *іпѕёгіпд, сһаг сопѕі *де1ітібегѕ); Ө 


уоійа ок аггау Ёгее (ок аггау *ок іп); 


© Макрос Зазре1п(Е, который мы уже рассматривали, повторен для удобства чте- 
ния. 

Ө Это массив лексем, который мы получаем, обратившись к функции оК аггау пен 
для разбиения строки. 

© Это обертка над ѕїгїок г, которая создает ок аггау. 
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В примере 9.6 показано, как с помощью библиотеки СТАЛЬ прочитать файл 
в строку и с помощью ѕёгіок г получить из одной строки массив строк. Примеры 
использования приведены в примерах 9.7, 12.2 и 12.3. 


Пример 9.6 * Некоторые полезные строковые утилиты (ѕїгіпо _иіііїіеѕ.с) 


#іпс1џае <91іБ.һ> 

#1пс1а4е <ѕігіпд.һ> 

#іпс1џде "ѕігіпд џбі1ібіеѕ.ћ" 
#іпс1џае <ѕЕаіо.һ> 

#1пс1и4е <аѕѕегё.һ> 

#іпс1џде <56а1іЬ.һ> //арогі 


сһаг *ѕёгіпд_Ёгот й1е(сһаг сопзЕ *#1епате) { 


сһаг *оџё; 

СЕггог *е = МОШ; 

СТОСВаппе] *Ё = д іо сһаппе1 пем Ї1е (Н1епате, "г", &е); Ф@ 
ІЁ В { 


Ғргіпё# (зе 4егг, "ошибка при открытии файла '%5'.\п", Ё1епате); 
геигп МОБЬ; 
} 


1Е (9 іо сһаппе1 геаа ёо епа (ё, &оџё, МОШ, бе) != С ІО ЅТАТОЅ _МОВМАГ) { 
Ерг1пЕ Е (зЕ4егг, "файл '%5' найден, но при его чтении ошибка. \п", 
у й]епапе) ; 


гебигп МОБЬ; 
} 


геёогп оиё; 


ок_аггау *оК аггау пем (сһаг *іпѕігіпд, сһаг сопзі *4е11т1%егз){ Ө 
ок _аггау *оџё= та11ос (ѕіг2еоЁ (ок аггау)); 
оце = (ок аггау) {.баѕе ѕігіпд=іпѕігіпд); 
сһаг *ѕсгасһ = МОБ; 
сһаг *ЕхЕ = ѕігіок г(іпѕёгіпд, де1ітібегѕ, &5сгаЁсћһ); 
1Е (1ЕхЕ) геёџгп МО; 


мһі1е (Ехё) { 
оцЕ->е1етепЕ$ = геа11ос (оџё->еїіетепёѕ, $12еоЕ (сһаг*) *++ (оџё->1епдёћ)); 
оџЕ->еІетепіѕ [оџё->1епӯёһћ-1] = хі; 


ЕхЕ = ѕЕгіок г(МОІІ, Ӣе1ітіёегѕ, &зсгаісћһ); 
} 
гебогп оце; 


} 


/* Освобождает исходную строку, потому что ѕігбок г ее испортила и 
больше она ни на что не годится. */ 
уоіа ок_аггау_ЁЕгее (ок аггау *ок_1п) { 

1Ё (ок іп == МОШ) гебигп; 

Етее (ок іп->раѕе ѕЕгіпд); 

Егее (ок іп->е1етепёѕ); 

Ғгее (ок іп); 


} 


{1Е4еЁ сеѕї ок аггау 
іпе таіп () { [3] 
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сһаг *ае1ітісегѕ = " `-!@#$%^&* () _-+={ [] }1\\;:\",<>./?\п"; 

ОК_аггау *0 = оК аггау пем ($ гаир ("Не110, геайег. Тһіѕ 15$ бехіё."), 
аеїітібегѕ); 

аѕѕегі (о->1Іепдёһћ==5); 

аѕѕегі (! зЕгстр (о->еіетепёѕ [1], "геайег")); 

аѕѕегі (! ѕёгстр (о->еіетепіеѕ [4], "бехі")); 


ок аггау Ёгее (о); 
ргіпеЁ ("ОК.\п"); 
} 
#епаі ғ 


© Хотя этот способ годится не всегда, я все же в восторге от возможности просто 
закачать весь файл в память, переложив заботы с программиста на оборудова- 
ние. Если файл слишком велик и целиком в файл не помещается, для достиже- 
ния того же эффекта можно воспользоваться функцией ппар. 

Ө Это обертка вокруг ѕігїіок г. Если вы дочитали до этого места, то понимаете, для 
чего здесь нужен цикл иВ1]е, а эта функция копирует получаемую на каждой 
итерации лексему в структуру ок аггау. 

Ө Если символ їеѕі ок аггау не определен, то это библиотека, которую можно ис- 
пользовать в других программах. В противном случае (СЕІАС5=-ріеѕї ок аггау) 
это исполняемая программа, которая тестирует функцию оК аггау пем, предла- 
гая ей разбить конкретную строку по символам, отличающимся от букв и цифр. 


Опісоде 


Во времена, когда все компьютеры были сосредоточены в США, была определена 
кодировка АЗСП (Атегісап З(апдаг4 Сое {ог шЮгтайоп Іпёегсһапре), сопостав- 
ляющая числовые коды всем обычным буквам и символам, имеющимся на клавиа- 
туре 9$ О\УЕКТУ. Этот набор символов я буду называть наивным английским. 
Тип С сћһаг занимает 8 бит (двоичных цифр), или 1 байт, то есть может представ- 
лять 256 различных значений. В кодировке АЗСП определено 128 символов, так 
что все они представимы типом сћаг, и один бит еще остается в запасе. Этот вось- 
мой бит во всех символах АЗСП равен 0, что оказалось весьма кстати. 

В кодировке ОФшсо4е применены те же основные принципы, только каждому 
глифу (визуальному образу, понятному людям) сопоставляется шестнадцатерич- 
ный код, как правило, из диапазона от 0000 до ЕЕЕЕ'. Принято обозначать такие 


' Диапазон от 0000 до ЕЕЕЕ называется основным многоязычным уровнем (ОМУ, или 
ВМР) и включает большинство, но не все символы, встречающиеся в современных 
языках. Другие кодовые позиции (теоретически от 10000 до 10ЕЕЕЕ) находятся на до- 
полпительных уровнях. Здесь размещены математические символы (например, символ 
множества вещественных чисел В) и унифицированный набор идеограмм китайского, 
японского и корейского языков (С]К). Если вы один из десяти миллионов китайцев на- 
родности мяо или один из сотен или тысяч говорящих на распространенных в Индии 
языках сора или чакма, то вам сюда. Да, подавляющее большинство тестов можно запи- 
сать символами из уровня ВМР но заверяю вас — предположение о том, что в любом 
тексте встречаются только символы с кодами меньше ЕЕЕЕ заведомо неверно. 
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кодовые позиции в виде (+0000. Работа по созданию кодировки Опісоде оказалась 
куда более трудной, потому что пришлось каталогизировать все обычные буквы 
западных алфавитов, десятки тысяч китайских и японских иероглифов, все обяза- 
тельные глифы угаритского и дезеретского алфавита и т. д. и т. п. – для всего зем- 
ного шара на протяжении всей истории человечества. Следующий вопрос - как все 
это закодировать, и вот тут начинаются расхождения. Главный вопрос – сколько 
байтов должна занимать единица, подвергающаяся анализу. В ОТЕ-32 (ОТЕ рас- 
шифровывается как ОСЅ Тгапѕѓогтабіоп Еогтаё — формат преобразования ОС, 
а 0С$ – как Ошуегза! СВагасцег Зе – универсальный набор символов) основной 
единицей считаются 32 бита, или 4 байта, а это означает, что каждый символ мож- 
но закодировать одной единицей, но ценой гигантского перерасхода памяти на 
дополнение до 4 байтов, ведь в наивном английском наборе каждый символ пред- 
ставлен всего 7 битами. В ОТЕ-16 основная единица составляет 2 байта, и этого 
хватает для представления большинства символов одной единицей, но некоторые 
приходится кодировать двумя. В ОТЕ-8 в качестве единицы используется 1 байт, 
и, следовательно, еще больше кодовых позиций приходится кодировать несколь- 
кими единицами. 

Я предпочитаю рассматривать кодировки ОТЕ как вариант тривиального шиф- 
рования. Для каждой кодовой позиции существует единственная последователь- 
ность байтов в ОТЕ-8, единственная последовательность байтов в ОТЕ-16 и един- 
ственная последовательность байтов в ОТЕ-32, и всеони имеют между собой мало 
общего. Если отвлечься от обсуждаемого ниже исключения, то нет никаких при- 
чин ожидать, что кодовая позиция и любое из его зашифрованных представлений 
будут численно одинаковы или вообще связаны хоть каким-то очевидным обра- 
зом, но я знаю, что правильно написанный программный декодер сможет легко и 
однозначно выполнить переход от любой кодировки ОТЕ к правильной кодовой 
позиции Ошсоде. 

А что используется на разных компьютерах? В веб есть непререкаемый лидер: 
в настоящее время свыше 80% сайтов пользуются кодировкой ОТЕ-8!'. Мас и 
пах также по умолчанию всегда применяют ОТЕ-8, так что есть все шансы, что 
никак не помеченный текстовый файл на машине под управлением Мас или [іпих 
представлен в кодировке ОТЕ-8. 

Примерно 10% сайтов в мире еще не перешли на Ошсоде, а используют доволь- 
но архаичную систему 15О/ТЕС 8859 (в которой имеются кодовые страницы, на- 
пример Гайп-1). А в Міпӣомѕ – свободомыслящей операционной системе, кото- 
рая посылает РОЅІХ на три буквы, – применяется ОТЕ-16. 

Отображение текстов в кодировке Опісойе — дело операционной системы, и 
дело непростое. Например, при печати наивного английского набора символов 
каждый символ занимает одну позицию в строке текста, но, к примеру, буква ив- 
рита з = р записывается в виде комбинации двух кодовых позиций 2 (0+0501) и 
(0+05ВС). Для построения составного символа к согласным добавляются глас- 


' р://мЗѓесћѕ.сот/сесһпоіоріеѕ/оуегуіем/сһагасіег епсойіпр /аї1. 
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ные: з = ра(9 +0501 + 9+05ВС + +0588). А сколько байтов потребуется для 
кодирования трех этих кодовых позиций в ОТЕ-8 (в данном случае шесть) – от- 
дельный, совершенно независимый вопрос. Говоря же о длине строки, мы можем 
иметь в виду число кодовых позиций, ширину на экране или количество байтов, 
необходимых для представления строки. 

И каковы же обязанности автора, который желает сделать свою программу по- 
нятной всем говорящим на столь разных языках? Вы должны: 

О определить, какую кодировку использует целевая система, чтобы случайно 
не начать читать входные данные в другой кодировке, и выводить результа- 
ты в виде, который система сможет декодировать; 
где-то сохранять текст в неизменном виде; 
понимать, что один символ необязательно представляется фиксированным 
числом байтов, поэтому, произвольно сместившись от начала строки, можно 
оказаться в середине кодовой позиции (если дана Ошсо4е-строка 15, то кта- 
кой неприятности может привести, например, операция џ5++); 

О иметь под рукой средства для различных манипуляций с текстом, ёоџррег и 
{01омег работают только для наивного английского, так что нужны альтер- 
нативы. 

Чтобы удовлетворить эти требования, вы должны будете выбрать правильную 

внутреннюю кодировку, чтобы не исказить текст, и располагать хорошей библио- 
текой, помогающей в деле декодирования. 


о 
о 


Кодировка для программ на С 


Выбрать внутреннюю кодировку совсем просто. ОТЕ-8 была спроектирована спе- 
циально для нас, программистов на С. 

О Единица в ОТЕ-8 составляет 8 бит: как раз длина сћаг!. Допустимо пред- 
ставлять строку в кодировке ОТЕ-8 как сћаг * — точно так же, как наивный 
английский текст. 

О Первые 128 кодовых позиций Отисоде в точности совпадают с кодировкой 
АЗСП. Например, букве А соответствуют код 41 (шестнадцатеричный) 
в АЅСП и кодовая позиция 0+0041 в Ошсоде. Поэтому если Опісоде-текст 
состоит только из наивных английских символов, то при работе с ним впол- 
не можно использовать как обычные средства, ориентированные на АЗСП, 
так и средства для работы с ОТЕ-8. Это возможно благодаря нехитрому 
трюку: если восьмой бит спаг равен 0, то сћаг представляет символ АЅСП, 
а если 1, то это один из байтов многобайтного символа. Таким образом; ни- 
какая часть символа Опісоде, которому нет соответствия АЗСП, в кодиров- 
ке ОТЕ-8 небудет совпадать ни с одним символом АЗСП. 

О 10+0000 – допустимая кодовая позиция, которую мы, пишущие на С, обо- 
значаем как '\0'. Поскольку \0 одновременно является и нулем в кодировке 


' Быть может, когда-то и существовали ориентированные на АЅСІІ машины, в которых 
длина сһаг составляла 7 бит, но в стандартах С99 и С11 $5.2.4.2.1(1) четко определено, что 
зпачепис СНАК, ВІТ должно быть не меньше 8; см. также $6.2.6.1(4), где байт определен 
как СНАК ВІТ битов. 
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АЅСП, то это правило — частный случай предыдущего. Это важно, потому 
что строка ОТЕ-8 с одним символом \0 в конце - это именно то, что счита- 
ется в С правильной строкой сћаг *. Вспомните, что в кодировках ОТЕ-16 
и ОТЕ-32 символ занимает несколько байтов, поэтому символы наивного 
английского набора дополняются до минимальной единицы; это означает, 
что первые 8 бит с большой вероятностью будут нулевыми, а следовательно, 
сохранение текста в кодировке ОТЕ-16 или ОТЕ-32 в переменной типа сћаг 
* даст строку, испещренную нулевыми байтами. 

Итак, о пишущих на С позаботились: закодированный в ОТЕ-8 текст можно 
хранить и копировать, пользуясь давно привычным нам типом строки сћаг *. Од- 
нако теперь, когда один символ может занимать несколько байтов, нужно следить 
за тем, чтобы не изменить порядка байтов и ни в коем случае не расщепить много- 
байтный символ. Если ничего такого вы не делаете, то можете спокойно работать 
со строкой, как будто она состоит из наивных английских символов. Ниже при- 
веден неполный перечень функций из стандартной библиотеки, безопасных от- 
носительно ОТЕ-8: 


О зїгаџр и ѕігпаџр; 

О зігсаї и ѕігпсаѓ; 

О зїгсрүи ѕігпсру; 

О определенные в РОЅІХ Баѕепапе и а1гпапе; 

О зігспр и ѕігпспр, но только для сравнения строк на равенство (нуль или не 
нуль). Для осмысленной сортировки понадобятся функции, учитывающие 
порядок символов (см. следующий раздел); 

О зігзѕіг; 

О ргшЁ и прочие функции из этого семейства, включая ѕргіпіёё, причем 
спецификатор%5 по-прежнему применяется для подстановки строки; 

О {ок г, ѕїгїок ѕ и ѕігѕер при условии, что разбиение производится по 
АЅСП-символу, например " \\л\г: |;,"; 

О {еп и эх еп, но помните, что возвращается число байтов, а не число ко- 


довых позиций и не ширина, занимаемая на экране. Для этих целей необ- 
ходима новая библиотечная функция, обсуждаемая в следующем разделе. 
Все эти функции работают на уровне байтов, но для большинства содержатель- 
ных операций стекстом требуется его декодировать. И это подводит нас к библио- 
текам. 


Библиотеки для работы с Утсоде 


Первое, что мы должны сделать, – преобразовать данные, пришедшие из внешнего 
мира, в ОТЕ-8, чтобы можно было с ними работать. А значит, нужны функции- 
привратники, которые кодируют входящие символы в ОТЕ-8 и перекодируют ис- 
ходящие строки из ОТЕ-8 в кодировку, ожидаемую потребителем. Они дают нам 
возможность внутри программы работать с одной разумной кодировкой. 

Именно так работает библиотека ШЬхті (см. раздел «ИЬхт| апі сОКІ» ниже): 
в правильном ХМГ-документе используемая кодировка указана в заголовке (но 
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в библиотеке есть набор правил для угадывания кодировки, если ее объявление 
отсутствует), поэтому [Г1Ьхш| знает, как производить перекодирование. іЬхті 
разбирает документ и преобразует его во внутренний формат, допускающий за- 
просы и редактирование. Отвлекаясь от возможных ошибок, можно быть уверен- 
ным, что внутренний формат представлен в кодировке ОТЕ-8, потому что 1Ьхті 
отказывается работать с любыми другими. 

Если вы собираетесь самостоятельно производить перекодирование на входе, 
то в вашем распоряжении имеется описанная в РОЅІХ функция 1сопу. С учетом 
того, сколько кодировок эта функция должна обрабатывать, она, надо полагать, 
невообразимо сложна. На случай, если в вашей системе ее нет, СМО предлагает 
переносимую библнотеку ПЫсопу. 

А 


Ке; 
- 


В стандарте РОЅІХ описана также командная утилита ісопу, обертывающая эту функцию. 


В библиотеке СТАЛЬ есть несколько оберток вокруг 1сопу, нас больше всего инте- 
ресуют 9 ІосаІе Ёо 018 ид 1оса1е Ёгоп 018. А в руководстве по СТЛ вы найдете 
длинный раздел, посвященный средствам манипуляции (Опісойе-текстами. Вы 
увидите, что есть два класса таких средств: для ОТЕ-8 и для ОТЕ-32 (для послед- 
ней в СГЛЬ предусмотрен тип дип1свах). 

Напомним, что 8 байтов даже близко не хватает для представления всех симво- 
лов одной единицей, поэтому одному символу может соответствовать от одной до 
шести единиц. Из-за этого ОТЕ-8 называется многобайтной кодировкой, и это же 
влечет за собой проблемы с вычислением истинной длины строки (где под длиной 
понимается количество символов или ширина на экране), получением следующе- 
го полного символа, получением подстроки или сравнением с целью сортировки 
(или упорядочением – соПаїіпр). 

В ОТЕ-32 применяется дополнение, так чтобы все символы можно было пред- 
ставить одним и тем же числом единиц, отсюда и название широкий символ. Не- 
редко встречается термин «преобразование из многобайтной кодировки в широ- 
кую» – теперь вы знаете, что это такое. 

Имея один символ в кодировке ОТЕ-32 (тип СТАЬ дип1сваг), вы можете безо 
всяких проблем делать с ним все, что принято делать с символами: получить тип 
(буква, цифра и т. д.), преобразовать регистр ит. д. 

Если вы читали стандарт С, то несомненно обратили внимание, что там описан 
тип широкого символа и все сопутствующие ему функции. Тип мсћаг появился 
еще в стандарте С89, то есть до публикации первой версии стандарта Опісоде. Не 
думаю, что он до сих пор полезен. Ширина исваг_{ в стандарте не оговорена, по- 
этому может быть равна и 32 бита, и 16 бит (и вообще какая угодно). Компиляторы 
в \Лп4до\/$ считают, что она равна 16 бит, чтобы не противоречить предпочтению, 
которое М1сгозой отдает кодировке ОТЕ-16, но ОТЕ-16 – это все же многобайт- 
ная кодировка, поэтому необходим еще один тип, гарантирующий кодирование 
с постоянной шириной символа. В С11 проблема исправлена за счет добавления 
типов сһаг16 Ё и сћаг32 Е, но пока что программ, в которых они используются, со- 
всем немного. 
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Пример кода 


В примере 9.7 приведена программа, которая читает файл и разбивает его на «сло- 
ва»; под этим я понимаю применение + г{оКк_г для разбиения на лексемы по про- 
белам и символам новой строки — широко распространенное определение. Для 
каждого слова я с помощью С14Ь преобразую первый символ из многобайтной 
кодировки ОТЕ-8 в широкую кодировку ОТЕ-32, а затем печатаю информацию о 
том, что он собой представляет: букву, цифру или широкий символ СЈК (то есть 
китайский, японский или корейский иероглиф, для печати которых обычно отво- 
дится больше места). 

Функция ѕЁгіпд Ёгоп їе читает все содержимое файла в строку, а затем 1оса1_ 
ѕгіпд о и(Ё8 преобразует его из локальной кодировки компьютера в ОТЕ-8. 
В моем использовании зігёоК г есть только примечательная особенность – тот 
факт, что ничего примечательного в нем нет. Если разбиение производится по 
пробелам и знакам новой строки, то гарантированно не произойдет расщепления 
многобайтного символа на две части. 

Я вывожу результат в формате НТМГ, потому что в этом случае могу указать 
кодировку ОТЕ-8 и не думать о кодировании на выходе. Если ваша операционная 
система работает в ОТЕ-16, откройте результирующий файл в браузере. 

Поскольку в этой программе используются библиотеки СЬ и зїгіпд и{11141е$, 
мой такеЁе выглядит следующим образом: 

СЕ1АСб5== `рка-сопііч --сЙад$ 9116-2.0` -9 -Иа11 -03 
рАрр= `рка-сопіёіч --11Ъ$ 911ір-2.0` 

СС=с99 

објесёѕ=ѕігіпд ибі1ібіеѕ.о 


опісоде: $ (орјесіѕ) 


В примере 10.21 приведена еще одна программа, работающая с символами 
Опісоде, она перечисляет все символы во всех находящихся в некотором каталоге 
файлах в кодировке ОТЕ-8. 


Пример 9.7 % Прочитать текстовый файли вывести полезную информацию 
о встретившихся символах (ипісоае.с) 


#іпс1џае <911Ы.һ> 

#іпс1џде <1оса1е.һ> //ѕес1оса1е 
#іпс1џае "эбгіпд ибі1ібіеѕ.һ" 
#іпсіџае "ѕборіЁ.һ" 


// Освобождает іпѕігіпд, больше ни для чего полезного ее 
// использовать нельзя. 
сһаг *1оса15ѕегіпд бо 0Є#8 (сһаг *іпѕбгіпд) { 
СЕггог *е=М0О11; о 
ѕес1оса1е (1С А1, ""); //получить локаль ОС 
сһаг *оџі = д Іоса1Іе бо 0СЕ8 (іпѕёгіпд, -1, МО, МОШ, ве); 
Ғгее (іпѕгіпд); // оригинал больше не нужен 
ЅіоріЁ (!9 08 уа1ідаѓе (оці, -1, МОШ), Ёгее (оџі); геіогп МОБ, 
"Ошибка: не удалось преобразовать ваш файл в строку ОТЕ-8."); 


} 
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гебигп оиб; 


іп ма1п (іпе агдс, сһаг **агду) { 


} 
© 


[2] 


[3] 


(41 


Ѕсорії (агдс==1, гебигп 1, "Укажите в аргументе имя файла. " 
"Я выведу полезную информацию о нем в џоџё.һёт1."); 
сһаг *0сѕ = 1оса1зігіпд Со иЁ#В (зігіпд Ёгот ёе (агду[1])); 
ЗЕор1Ё(!ис$, гебигп 1, "Ехібіпд."); 
ЕТЬЕ *00Є = Ғореп ("цой .Һет1", "м"); 
ЗЕор1Ё (! оџё, геёџгп 1, "Не удалось открыть џоое.һем1 для записи."); 
ҒргіпЕ# (оці, "<һеаа><теба һер-еаџім=\"СопёепЕ-Туре\" " 
"сопёепі=\"Еехі/ћЕт1; сһагѕеб=0ОТЕ-8\" />\п"); 
Ергіпе ё (оце, "В этом документе%1і символов. <№рг>", д обЁ8 ѕігіеп(исѕ, -1)); (2) 
Ерг1пЕЁ (ое, "Для кодироввания в Опісойе потребовалось%20џ байтов. <Ьг>", 
ѕЕг1еп(исѕ)); 
Ғргіпе# (оџё, "Вот он, по одному ограниченному пробелами элементу " 
"в строке (с комментарием о первом символе) : <Ьг>"); 
оК аггау *зрасе4 = ок_аггау_пем(исз, " \п"); © 
Ғог (іп 1=0; 1< ѕрасеа->1епдһ; 1++, (зрасед->е1етепез)++) { 
Ерг1пЕ Е (ооё, "%5", *зрасед->е1етеп{з); 


дип1сваг с = 9 0џС#8 деб сһаг (*ѕрасед->е1етепіѕ); ө 
1Ё (9 ипісһаг іѕа1рћһа (с)) Ёргіпе# (ооё, " (а 1еббег)"); 

1Е (9 опісһаг іѕаӢідіє(с)) Ёргіпё# (ооё, " (а 9191%)"); 

іЁ (9 џпісһаг іѕміде (с)) Ёргіпёё (оце, " (міде, СЈК)"); 


Ғргіпе# (ооё, "<рг>"); 
} 
Ес1озе (оц); 
рг1пЕЁ ("Информация выведена в џоџё.ћіт1. Откройте файл в браузере. \п"); 


Это привратник на входе, он преобразует символы из локальной кодировки 
компьютера в ОТЕ-8. Привратника на выходе нет, потому что я пишу в НТМІ- 
файл, а браузеры знают, как поступать с ОТЕ-8. Привратник на выходе был бы 
очень похож на эту функцию, только вызывал бы 9 Іоса]е Ёгот 08. 

ѕгІеп принадлежит к функциям, которые считают, что в каждом символе ровно 
один байт, поэтому ее необходимо заменить. 

Рассмотренная выше функция оК аггау пен разбивает текст по пробелам и зна- 
кам перехода на новую строку. 

Здесь мы видим несколько операций над одним символом, которые работают 
только после преобразования из многобайтной кодировки ОТЕ-8 в широкую 
кодировку с постоянной шириной символа. 


бейехі 


Наверное, ваша программа выводит множество сообщений пользователям, например 
сообщения об ошибках и приглашения. По-настоящему дружественная к пользовате- 
лю программа переводит эти тексты на разные языки - чем больше, тем лучше. Ин- 
струмент СМУ Се{ех{ предлагает систему для организации переводов. Руководство 
по Сецех{ написано довольно хорошо, поэтому за деталями отсылаю к нему, а здесь 
скажу лишь пару слов, чтобы вы могли составить себе представление о процедуре 
в целом. 
® Замените все сообщения вида "Нипап пеззаде" в программе на ("Нитап пеззаде"). Знак 
подчеркивания - это макрос, который в конечном итоге расширяется в вызов функ- 
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ции, выбирающей строку, соответствующую локали компьютера, на котором испол- 
няется программа. 

Выполните программу хде {ех\, которая составит индекс строк, нуждающихся в пе- 
реводе, в виде переносимого объектного шаблона - роѓ-файла. 

Отправьте этотро!-файл коллегам, говорящим на других языках, и попросите их при- 
слать ро-файлы с переводом строк на свой родной язык. 

Включите всвойфайлсопйдиге.ас макрос АМ С№О СЕТТЕХТ (наряду с другими необяза- 
тельными макросами, определяющими, где искать ро-файлы и другие детали такого 
рода). 


пә ПО 


эозов ооо ооо оо ооо ооо ооо во оо оо ооооо9о 


Улучшенная структура 


Двадцать девять разных признаков, 
и только семь из них тебе нравятся. 


— Тће Ѕгокеѕ «Уои Опіу Шуе Опсе» 


Это глава о функциях, которые принимают на входе структуры, и о том, какулуч- 
шить интерфейс с библиотекой. 

Мы начнем с трех синтаксических новаций, включенных в стандарт 150 С99: 
составные литералы, макросы с переменным числом аргументов и позиционные 
инициализаторы. По существу, эта глава представляет собой развернутое обсуж- 
дение того, что можно сделать с помощью различных комбинаций этих трех эле- 
ментов. 

Составные литералы, взятые сами по себе, упрощают передачу списка функции. 
Макросы с переменным числом аргументов позволяют скрыть синтаксис состав- 
ных литералов от пользователя, который видит только функцию, принимающую 
список произвольной длины: и # (1, 2), и #(1, 2, 3, 4) допустимы. 

С помощью похожего трюка можно было бы реализовать ключевое слово 
Ғогеасћ, встречающееся во многих языках, или векторизовать функцию с одним 
аргументом, так чтобы она могла применяться к нескольким аргументам. 

Позиционные инициализаторы существенно упрощают работу со структура- 
ми – настолько, что я почти перестал пользоваться старым способом. Вместо не- 
понятной и чреватой ошибками конструкции регѕоп зїгисі р = ("Јое", 22, 75, 20} 
мы можем писать самодокументированные объявления вида регѕоп гис р = 
{ .пате=" ое", .аде=22, .меідһё Кд=75, .ейџсаёіоп уеаг5=20}. 

Нуаколь скоро инициализация структуры перестала быть занозой, то и возврат 
структуры из функции оказывается столь же простым, и это позволяет сделать 
интерфейс функции прозрачнее. 

Передача структуры функции также стала проще. Обернув все еще одним мак- 
росом с переменным числом аргументов, мы теперь можем писать функции, при- 
нимающие переменное число именованных аргументов, и даже присваивать зна- 
чения по умолчанию тем аргументам, которые пользователь не задал. В примере 
программы кредитного калькулятора имеется функция, которую можно вызы- 
вать и так: атогііғаѓіоп (.атоџлі=200000, .гаке=4.5, .уеагѕ=30), и так: атог&12ае1оп (. 
гаіе=4.5, .атоџпі=200000). Поскольку во втором случае срок кредита не указан, 
функция по умолчанию подставляет 30 лет. 
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Далее в этой главе будут приведены примеры ситуаций, в которых входные и 
выходные структуры могут облегчить жизнь, в том числе при работе с функциями, 
интерфейс которых основан на указателях на уоій, а также когда унаследованный 
код имеет столь чудовищный интерфейс, чтоего хорошо бы обернуть чем-то более 
удобным. 


Составные литералы 


Передать функции литеральное значение ничего не составляет: если имеется объ- 
явление йоџр1е а_уа11е, то С прекрасно понимает, что такое ї (а уа1џе). 

Но если вы хотите передать список элементов — составное литеральное зна- 
чение вида (20.38, а мае, 9.8}, – то возникает синтаксическое неудобство: тре- 
буется поставить перед составным литералом оператор приведения типа, иначе 
анализатор не поймет, что имеется в виду. Теперь список выглядит как (д9о1Ые []} 
{20.38, а мае, 9.8}, а обращение принимает вид: 


Е( (ЧочЬ]1е[]) {20.38, а_уа1ше, 9.8}); 


Память для составных литералов выделяется автоматически, то есть ни па11ос, 
ни Ётее не нужны. В конце области видимости, в которой появился составной ли- 
терал, он попросту исчезает. 

Пример 10.1 начинается довольно типичной функцией ѕип, которая принимает 
массив элементов типа йоџр]е и вычисляет их сумму, пока'не встретится первый 
элемент МаМ (нечисло, см. раздел «Пометка недопустимых числовых значений 
с помощью маркера Ма№» выше). Если во входном массиве нет элементов МаМ, то 
результат будет катастрофическим; позже мы добавим меры предосторожности. 
Из паіп эта функция вызывается двумя способами: традиционным - с использо- 
ванием временной переменной - и с помощью составного литерала. 


Пример 10.1 * Мы можем обойтись без временной переменной, 
воспользовавшись составным литералом (ѕит 4о_пап.с) 


#1пс1а4е <таєћһ.һ> //МАМ 
#іпс1џае <5аіо.һ> 


аочЬ1е зим (доџр1е іп[]) { © 
аоџр1е оџё=0; 
Ғог (116 1=0; !іѕпап (іп[1]); 1++) ооё += іп[і]; 


гебигп оиб; 


} 


іпЕ таіп() { 
Ӣоџр1е 11ѕ6[] = (1.1, 2.2, 3.3, МАМ}; (2, 
ргіпеЁ ("ѕит: %9\п", зим (11$6)); 


ргіпеЁ ("ѕит: %9\п", зим ( (даоџр1е([]) (1.1, 2.2, 3.3, МАМ})); © 
} 


© Эта ничем не примечательная функция складывает элементы входного масси- 
ва, пока не дойдет до первого маркера МаМ. 
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Ө Это типичный случай использования функции, которая принимает на входе 
массив. В первой строчке мы объявляем временную переменную, содержащую 
список, а во второй передаем эту переменную функции. 

Ө Здесь мы делаем то же самое без заведения промежуточной переменной – для 
инициализации массива используется составной литерал, который передается 
функции непосредственно. 


Это простейший пример использования составных литералов; далее в этой гла- 
ве мы увидим, как они применяются и для других целей. А пока проверьте, нет ли 
в ваших программах мест, которые можно было бы упростить за счет инициализа- 
ции однократно используемых списков составными литералами. 

7 У В этом примере создается массив в автоматической памяти, а не указатель на мас- 


\/ сив, поэтому параметр функции следует описывать как имеющий тип (д006]е []), а не 
- _(доџр]е*). 


Инициализация с помощью составных литералов 


Остановимся на одном тонком различии, которое, возможно, поможет вам лучше 
понять принцип работы составных литералов. 
Надо полагать, вы давно привыкли объявлять массивы следующим образом: 


аоџЬ1е 1150[] = {1.1, 2.2, 3.3, МАМ}; 


Здесь выделяется память для именованного массива 1154. Результат вычисле- 
ния 512601 (115%) равен 4 * $512е0# (9ои1е). Иными словами, 1154 — это самый на- 
стоящий массив (в смысле, описанном в разделе «Автоматическая, статическая и 
динамическая память» выше). 

Можно было бы воспользоваться для объявления составным литералом, о на- 
личии которого свидетельствует приведение к типу (оџр1е[]): 


аоџр1е *115& = (аӢоџр1е[]) {1.1, 2.2, 3.3, МАМ}; 


При этом система сначала генерирует анонимный список, вставляет его в кадр 
стека, принадлежащий функции, а затем объявляет указатель 113+ на этот аноним- 
ный список. Таким образом, 1154 оказывается псевдонимом, а 512е0# (115%) равно 
$12е0Е (йоџр1е* ). Это наглядно продемонстрировано в примере 8.2. 


Макросы с переменным числом аргументов 


Вообще говоря, я считаю, что механизм функций с переменным числом аргумен- 
тов в языке С дефектный (подробнее об этом см. в разделе «Гибкая передача ар- 
гументов функциям» ниже). Однако с макросами такой проблемы не возникает. 
Ключевое слово ҮА АВб$ расширяется в переданный набор аргументов. 

Пример 10.2 – это повторение примера 2.5 – специализированный интерфейс 
к функции ргіпіё, которая печатает сообщение, если утверждение ложно. 
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Пример 10.2 * Тот же макрос для обработки ошибок, что в примере 2.5 (5їоріѓ.ћ) 


#іпс1џае <ѕіаіо.һ> 
#іпс1џде <56а1ір.һ> //арогі 


/** Присвоить этой переменной значение \с '5', если нужно, чтобы программа 
останавливалась после ошибки. 
В противном случае программа будет возвращать код ошибки. * / 

сһаг еггог поае; 


/** Куда писать сообщения об ошибках? Если \с М№МОІ1, писать в \с ѕёйегг. */ 
РТЬЕ *еггог 109; 


#аеїіпе Зкор1Ё (аззег®1оп, еггог асііоп, ...) {\ 
1Е (аззегЕ1оп) { \ 
Ерг1п%Е (еггог 109 ? еггог 109 : з&4егг, МА АКСЅ5 ); \ 


Ерг1пЕЕ (еггог 109 ? еггог 109 : ѕЇідегг, "\п"); \ 
1Е (еггог тойе=='5') аБог®(); \ 
е1ѕе {еггог асёіоп; } \ 


} } 


// пример использования: 
ЗЕор1Ё (х<0 || х>1, гевигп -1, "значение х равно%д, " 
"а должно быть числом от нуля до единицы. ", х); 


Все, что пользователь напишет на месте многоточия (:..), будет подставлено 
вместо маркера __ ҮА ААС5 . 

Чтобы продемонстрировать потенциальные возможности макросов с перемен- 
ным числом аргументов, мы в примере 10.3 реализовали синтаксис цикла ог. Все 
находящееся после второгоаргумента — сколько бы запятых там ни было - счита- 
ется аргументом ... и подставляется вместо маркера __\УА_АВС$ . 


Пример 10.3 * Многоточие... в макросе скрывает за собой все тело цикла Ёог 
(уагаа.с) 


#іпс1џде <5аіо.һ> 


#Аейпе Ғог1оор (і, Іоортах, ...) Ёог(іпё 1=0; 1< 1оортах; 1++) \ 
{ УА_АВС$__} 
іп маіп() { 
іп ѕит=0; 
Ғог1оор (1, 10, 
зим += і; 


ргіпеЁ ("зим 60%1:%1\п", і, зим); 


Я бы не стал пользоваться кодом из примера 10.3 в реальной программе, но 
лишь слегка различающиеся фрагменты встречаются достаточно часто, и иногда 
для устранения избыточности стоит воспользоваться макросами с переменным 
числом аргументов. 
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Безопасное завершение списков 


Составные литералы и макросы с переменным числом аргументов – сладкая па- 
рочка, позволяющая применять макросы для построения списков и структур. 
К структурам мы перейдем чуть позже, а пока займемся списками. 

Пару страниц назад мы видели функцию, которая принимает список и склады- 
вает его элементы, пока не встретится первый маркер МаМ. Для использования 
этой функции знать длину входного массива необязательно, но должна быть га- 
рантия, что в конце его находится элемент МаМ; если это не так, ждите нарушения 
защиты памяти. Гарантировать наличие завершающего маркера Ма можно путем 
вызова зип через макрос с переменным числом аргументов, как в примере 10.4. 


Пример 10.4 + Использование макроса с переменным числом аргументов 
для порождения составного литерала (ѕаїе_ѕит.с) 


#1пс1а4е <таєһ.һ> //МАМ 
#1пс10и4е <56аіо.һ> 


аоџЬІе зит_аггау(аочЬ1е іп[]) { о 
аоџр1е оџѓ=0; 
Ғог (іп 1=0; !іѕпап (іп[1]); і++) оце += іп([1]; 


гесигп оцё; 


} 


#Аейпе зит(...) зит_аггау( (4очЬ1е[]) {__УА_АВб$__, МАМ}) Ө 
іп таіп() { 
аоџр1е ёмо апі бно = зит(2, 2); (3, 


ргіпеё ("2+2 =%9\п", Емо апа (мо); 
ргіпеё (" (2+2) *3 =%9\п", зим (Емо_ап4_Емо, емо апа мо, мо апа їмо) ); 
ргіпеЁ ("ѕит(аѕѕё) =%9\п", зит(3.1415, ёмо апа емо, 3, 8, 98.4)); 

) 


© Функция называется иначе, но по-прежнему занимается суммированием эле- 
ментов массива. 

Ө Именно в этой строке происходит самое интересное: макрос с переменным чис- 
лом аргументов копирует свои аргументы в составной литерал. Таким образом, 
макрос принимает произвольное количество значений типа доц]е, а передает 
их в виде одного списка, в конце которого гарантированно находится МаМ. 

Ө Теперь паіп может передавать макросу зип списки чисел произвольной длины, 
ао добавлении завершающего маркера МаМ пусть заботится сам макрос. 


Думаю, вы согласитесь, что это изящная функция. Она принимает столько 
входных параметров, сколько у вас есть, не заставляя предварительно упаковы- 
вать их в массив. Достигается это за счет того, что макрос пользуется составным 
литералом для инициализации массива. 

На самом деле макрос работает только с отдельными числами, массивов он не 
понимает. Если у вас уже есть массив и вы уверены, что он завершается маркером 
МаМ, то вызывайте функцию ѕит аггау напрямую. 
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Несколько списков 


А что, если требуется передать два списка произвольной длины? Пусть, например, 
программа должна извещать об ошибках двумя способами: печатать понятное че- 
ловеку сообщение и записывать машиночитаемый код ошибки в журнал (я буду 
использовать в этом качестве $&4егг). Хорошо бы иметь одну функцию, прини- 
мающую аргументы для обеих функций вывода в духе ре1п(Е, но как компилятор 
поймет, где заканчивается один набор аргументов и начинается следующий? 

Можно сгруппировать аргументы, какмы это всегда делаем: с помощью скобок. 
При обращении к макросу ту пасго вида пу пасго(Ё(а, Б), с) первым аргументом 
будет все выражение Е (а, р) – запятая внутри скобок не считается разделителем 
аргументов макроса, потому что в таком случае была бы нарушена семантика ско- 
бок и получилась бы чепуха [С99 и С11 $6.10.3(11)]. 

А раз так, то можно следующим образом написать код, печатающий сразу два 
сообщения об ошибке: 
#аейіпе {і1ергіпё# (...) ЕргапЕЕЁ (зЕ4егг, __МА АВС$ __) 


#аеѓіпе доир1ерг1пЕЁ (потап, масћһіпе) \ 
ао {рг1пЕЁЕ Витап; Н1ерг1пЕЁ тасһіпе; } мһћі1е (0) 


// пример использования: 
іЁ (х < 0) 
аоџр1ергіпі# ( ("х отрицательно (равно:%9) \п", х), ("МЕСУАЬ: х=%9\п", х)); 


Результатом расширения этого макроса является такой код: 


ао {ргіпёё ("х іѕ отрицательно (равно: %9) \п", х); \ 
Н]ерг1пЕЁ ("МЕСУАЬ: х=%9\п", х); } 
мһћі1е (0); 


Я добавил макрос Ё1ергіпёЁ для единообразия. Не будь его, аргументы ргілі# 
для вывода сообщения человеку нужно было бы заключать в скобки, а аргументы 
ргіпё# для вывода в журнал – оставить вне скобок: 


#аеѓіпе аоџЬ1ергіпі# (ћитап, ...) ао {ргіпё# һотап; \ 
Ерг1пЕЕ (зЕаегг, _ УА_АВС$ _);} мћі1е (0) 


// и затем так: 
і (х < 0) 
аоџр1ергіпе# ( ("х меньше нуля (равно: %9) \п", х), "МЕбУАЬ: х=%а\п", х); 


Это вполне корректный синтаксис, но мне он не нравится, потому что функ- 
ционально однотипные вещи должны и выглядеть одинаково. 

А если пользователь вообще забудет про скобки? Тогда код не откомпилирует- 
ся: почти любой символ после ргіпіё, кроме открывающей круглой скобки, при- 
ведет к загадочному сообщению об ошибке. Итак, с одной стороны, непоиятное 
сообщение, зато с другой – невозможность случайно забыть скобки и тем самым 
поставить заказчику неправильный код. 

В примере 10.5 показано еще одно применение макросов: если даны два списка 
Ви С, то элемент ($, /) будет содержать произведение К, С, В основе этого примера 
лежит макрос пабгіх сгоѕѕ с достаточно удобным интерфейсом. 
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Пример 10.5 * Передача функции двух списков переменной длины (їітеѕ їабіе.с) 
#іпс1џае <таёћ.һ> //МАМ 
#1пс1а4е <ѕЕаіо.һ> 


#АеНпе таке а 1156(...) (аоџр1е[]) {__ УА АКСЅ__, МАМ} 


#ЧеНпе тагіх сгоѕэ (11561, 11502) тасгіх сгоѕѕ Браѕе (таке а 1іѕі 1іѕё1, \ 
таке а 1іѕі 11562) 


уоіа таёгіх сгоѕѕ раѕе (дДоџр1іе *1151, доџр1е *11502) { 
іп соцпс1 = 0, соцпе2 = 0; 
мһі1е (! іѕпап (11501 [соџпё1])) соџпё1++; 
мһі1е (!іѕпап (11502 [соџпЕ2])) соџпё2++; 
іЁ (!соипё1 || ! соцпе2) {рг1пЕЕ ("отсутствуют данные."); гебагп; } 


Ғог (іп 1=0; і<соцпё1; 1++) { 
Ғог (106 ј=0; ј<сооџпе2; ј++) 
ргіпе# ("%9\Е", 11501 ([1)*11502([3]); 
ргіпі# ("\п"); 
} 
рг1пЕЕ ("\п\п"); 
} 


106 таіп() { 
таёгіх сгоѕѕ ( (1, 2, 4, 8), (5, 11.11, 15)); 
паег1х_сгоз$ ( (17, 19, 23), (1, 2, 3, 5, 7, 11, 13)); 
па г1х_сгоз$ ( (1, 2, 3, 5, 7, 11, 13), (1)); // вектор столбцов 


Ғогеасћ 


Как мы уже видели, составной литерал можно использовать всюду, где допустим 
массив или структура. Вот, например, как с помощью составного литерала объ- 
является массив строк: 


сһаг **5№гіпдѕ = (сһаг* []) {"Уагп", "Ем1пе"}; 
Теперь обернем это циклом ог. В первом компоненте цикла объявляется мас- 
сив строк, так что мы можем воспользоваться показанным выше предложением. 


Затем мы выполняем итерации, пока не достигнем завершающего маркера МИ. 
Чтобы было понятнее, я ввел уреде{ для типа строки: 


#1пс1а4е <зЕа1о.Н> 
бурейе# сһаг* ѕігіпд; 


іле таіп () { 
ѕегіп9 ѕёг = "Єһгеаа"; 
Ғог (ѕбгіпд *1іѕі = (ѕігіпо[]) {"уагп", зЕг, "горе", МОШ}; *1150; 1іѕе++) 


ргіпёеЁ ("%5\п", *1136); 
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Это еще чересчур многословно, поэтому уберем синтаксический шум внутрь 
макроса. Вот теперь паіп оказывается настолько чистой, насколько возможно: 


#іпс10џдӢе <5аіо.һ> 


// На этот раз я обошелся без ёуредеѓ. 


#аеїіпе Еогеасһ ѕёгіпд (ібегаёог, ...)\ 

Ғог (сһаг **іїегаіог = (сһаг*[]) {__ МА ААС5 , МОГ}; *ібегаёог; 
106 таіп () { 

сһаг *56г = "Єһгеаа"; 


Ғогеасһ зігіпд (і, "уагп", хг, "горе") { 
ргіпёё ("%5\п", *1); 


} 


Векторизация функции 


Функция Ғгее принимает ровно один аргумент, поэтому часто код очистки в конце 
функции включает длинные цепочки вида: 

Ғгее (рЁг1); 

Ғгее (рёг2); 


Егее (рёг3); 
Егее (рЁг4); 


Ну раздражает же! Ни один уважающий себя программист на 18Р не потерпел 
бы такой избыточности, а написал бы векторизованную функцию їгее, которую 
можно было бы вызывать так: 


Ғгее а11(ріг1, рёг2, рёгЗ, рёг4); 


Если вы дочитали до этого места, то следующая фраза не вызовет недоумения: 
мы можем написать макрос с переменным числом аргументов, который генериру- 
ет массив (с завершающим маркером) с помощью составного литерала, азатем вы- 
полняет цикл ог, в котором функция применяется к каждому элементу массива. 
В примере 10.6 показана реализация этой идеи. 


Пример 10.6 + Техника векторизации произвольной функции, принимающей 
указатель любого типа (уесїогіге.с) 


#1пс1и4е <з&а1о.в> 
#іпс1џае <$%а11Ь.Н> //та11ос, Егее 


#фАейпе Еп арр1у (ёќуре, Ёп, ...) { \ о 
уоіа *ѕёоррег ѓог арріу = (іпе[]) {0}; \ 2, 
Суре **115ѕ Ғог арріу = (ёуре* []) {__ УА АКСЅ , ѕіоррег Ғог арр1у); \ 
Ғог (іп 1=0; 11ѕ Еог_арр1у[1] != ѕіоррег Ёог арр1у; і++) \ 
Ёп (1150 _Еог_арр1у[1]); \ 
} 
#АеНпе Ргее_а11(...) Гп_арр1у (уоіа, Егее, _ УА АКС5__); 


іп ма1п() { 
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ЧочЬ1е *х= та11ос (10); 
аоџЬ1е *у= та11ос (100); 
оцЬ1е *2= та110ос (1000); 
Егее а11 (х, у, 2); 


} 


© Для пущей безопасности макрос принимает имя типа. Я поставил его раньше 
имени функции, потому что порядок «тип, затем имя» принят и при объявле- 
нии функций. 

Ө Необходим завершающий маркер, который заведомо не совпадает ни с одним из 
используемых в программе указателей, в том числе МІ, поэтому мы воспользу- 
емся составным литералом, чтобы инициализировать массив из одного целого 
числа, и укажем на этот массив. Обратите внимание, что в условии окончания 
цикла проверяется сам указатель, а не значение, на которое он указывает. 


Подготовив все необходимое, мы можем обернуть этим векторизующим макро- 
сом любую функцию, принимающую один указатель. При работе с библиотекой 
С$Г. можно было бы определить: 


#АеНпе б51 уесёог Ёгее а11(...) \ 
Рп_арр1у (951 месбог, 951 уесіог Ёгее, __УА_АВб$ ); 
#дебіле С51 тагіх Ёгее а11(...) \ 


Рп_арр1у (951 таёгіх, 951 табгіх Ёгее, “А АВАС5 ); 


Мы не отказываемся от проверки типов на этапе компиляции (если только тип 
указателя не \019), а это гарантирует, что на вход макросу подается список указа- 
телей одного и того же типа. Если необходимы разнородные элементы, то понадо- 
бится еще один прием – позиционные инициализаторы. 


Позиционные инициализаторы 


Эту идею я проиллюстрирую на примере. Ниже приведена короткая программа, 
которая выводит на экран решетку ЗхЗ и в одной ячейке печатает звездочку. Мес- 
тоположение звездочки – правая верхняя ячейка, левая средняя и т. д. – задается 
в структуре дігесііоп $. 

В примере 10.7 наибольший интерес представляет функция па1п, в которой 
объявлены три такие структуры с помощью позиционных инициализаторов, — мы 
указываем в инициализаторе имена элементов структуры. 


Пример 10.7 + Задание структуры с помощью позиционных инициализаторов 
(бохеѕ.с) 
#іпс1оае <56аіо.һ> 


бурейе# ѕёгосё { 

сһаг *пате; 

106 1е#є, гідћё, ор, Чомп; 
} аігесбіоп 5; 


уоіа Еһіѕ гом (аігесііоп 5 а); // эти функции находятся ниже 
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уоіа агам рох (дігесёіоп ѕ а); 


іп таіп() { 
дігесёіоп ѕ 0 = {.пате="1еѓё", .1еЁк=1}; © 
гам Бох (р); 


р = (адігесііоп ѕ) {"иррег гідһё", .ир=1, .гідһё=1}; (21 
гам Бох (р); 


гам Бох ( (дігесііоп 5) {}); 9 


} 


уоіа №13 гом (91гес{оп_з 4) {: ө 
ргіпёё( а.1еёё ? "*..\п" 
: а.гідће ? '"..*\п" 
".*.\п"); 


} 


уоіа агам бох (91гесЕ1оп_$ а) { 


ргіпёЁ ("%5:\п", (а. пате ? Ч.паме : "а Ъох")); 

а.ор ? Еһ1ѕ гом (4) : ргіпёЁ("...\п"); 
(1а.џр && !а.ӣомп) ? Єһіѕ гом (4) : ргіпЕ# ("...\п"); 
а.аомп ? Еһіѕ гом (а) : ргіпё# ("...\п"); 
ргіпеЁ ("\п"); 


} 


© Это наш первый позиционный инициализатор. Поскольку элементы .гідћё, .0р 
и .йомп не заданы, то им присваивается значение 0. 

Ө Естественно сначала задавать имя, поэтому мы можем указать его в качестве 
первого инициализатора, опустив метку, – к неоднозначности это не при- 
ведет. 

Ө Это крайний случай - все элементы структуры инициализируются нулями. 

Ө Все, что идет после этой строки, касается отображения решетки на экране, ни- 
чего нового в этом нет. 


Раньше для инициализации структуры нужно было помнить порядок ее эле- 
ментов и перечислять их значения без меток, поэтому объявление џррег гідћі вы- 
глядело бы так: 


аігесііоп 5 оргідћё = (МОБ, 0, 1, 1, 0}; 


Эту запись невозможно понять, именно из-за таких вещей язык С не любят. 
Поэтому, за исключением редких ситуаций, когда порядок естественный и очевид- 
ный, не пользуйтесь синтаксисом без меток. 

О Вы заметили, что при инициализации структуры иррег гідћ элементы пере- 
числены не в том порядке, в каком они следуют в объявлении структуры? 
Жизнь слишком коротка длятого, чтобы помнить порядок элементов в мно- 
жествах, где он выбран произвольно, – пусть разбирается компилятор. 

О Необъявленные элементы инициализируются нулями. Ни один элемент не 
остается неопределенным. 
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О Позиционные и обычные инициализаторы могут употребляться в одном 
предложении. В примере 10.7 казалось естественным, что имя идет вначале 
(и что строка "иррег гідћ" не является целым числом), поэтому даже если 
имя не снабжено явной меткой, объявление все равно будет корректным. 
Общее правило состоит в том, что компилятор продолжает с того места, на 
котором остановился: 


фуредеЁ ѕігосї { 


іпе опе; 
аӢоџріе мо, ЕНгее, Ёойг; 
} п 3; 
п_$ јиѕсопе = (10, .Єһгее=8); // 10 без метки сопоставляется первому элементу: 
// .0пе=10 
п з Сһгееѓоџг = {.бмо=8, 3, 4}; // поправилу продолжения, 3 сопоставляется 


// элементу, следующему за 1шо: іћгее=3 и „јошг=4 


Я начал знакомство с составными литералами на примере массивов, но если 
принять во внимание, что структуры - это почти массивы, только с именован- 
ными элементами неодинакового размера, то становится понятно, что составные 
литералы годятся и для структур, что и было продемонстрировано на примере 
структур уррег гідћ и сепѓег. Как и раньше, перед фигурными скобками нужно 
поставить оператор приведения типа (имя типа). 

Первый пример в паіп — непосредственное объявление, синтаксис составного 
инициализатора здесь не нужен; в последующих примерах с помощью составно- 
го литерала инициализируется анонимная структура, которая затем копируется 
в переменную 0 или передается функции. 

Ваша очередь. Перепишите объявления всех структур в своем коде с использованием 
позиционных инициализаторов. Да-да, именно это я и хотел сказать. Старомодная ини- 


циализация, в которой не понятно, какие значения каким полям присваиваются, просто 
ужасна. Обратите внимание, что неказистый код вида 


аігесёіоп з р; 


р.1еЕе = 1; 
”р.гідћё = 0; 
р.ор = 1; 

р.аомп = 0; 


можно переписать и так: 
аігесііоп з р = (.1еЁє=1, .ир=1}; 


Инициализация массивов и структур нулями 


Переменная, объявленная внутри функции, автоматически не обнуляется (и для 
переменных, которые называются автоматическими, это, пожалуй, несколько 
странно). Полагаю, что так сделано ради повышения быстродействия: для обну- 
ления кадра стека, отведенного функции, требуется дополнительное время, и если 
функция вызывается миллион раз, а на дворе 1985 год, то эти накладные расходы 
могут стать ощутимыми. 
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Нов наши дни оставлять переменную неинициализированной значит напраши- 
ваться на неприятности. 

Простой числовой переменной можно присвоить нулевое значение в той стро- 
ке, где она объявлена. Указателям, в том числе строкам, присваивайте значе- 
ние №. Ничего сложного тут нет, а если вы забудете, то хороший компилятор 
предупредит о попытке использования неинициализированной переменной. 

Что касается структур и массивов фиксированного размера, то, как было пока- 
зано выше, компилятор обнуляет все элементы, кроме тех, которым явно присвое- 
но значение с помощью позиционного инициализатора. Поэтому, чтобы обнулить 
всю структуру, достаточно задать пустой инициализатор. Ниже эта идея иллюст- 
рируется на примере программы, которая не делает ничего полезного: 
фуредеё зегисЕ { 


іпе 1а, де, да; 
} 1а4еда_$; 


іпЕ таіп() { 
1адеда ѕ етрёуѕёгисе = {}; 
іп 11[20] = {}; 


Просто и красиво, правда? 

А теперь о грустном: допустим, имеется массив переменной длины (которая за- 
дается с помощью переменной во время выполнения). Единственный способ ини- 
циализировать его – воспользоваться функцией пепзе{: 

106 таіп () { 
іп 1Іепдбһ=20; 
116 11 [1епдёһ]; 
метзе{ (11, 0, 20*5ігеоЁ (іпё)); 


Так уж устроена жизнь. 


А] Ваша очередь. Напишите макрос для объявления массива переменной длины и обнуле- 
ния всех его элементов. На вход макросу нужно подать тип, имя и размер массива. 


Для инициализации разреженных, но все же не пустых массивов можно исполь- 
зовать позиционные инициализаторы: 


/ / По правилу продолжения, следующее объявление эквивалентно {0, 0, 1.1, 0, 0, 2.2, 3.3}: 
аооџр1е 11561[7] = {[2]=1.1, [5]=2.2, 3.3} 


Псевлонимы типов спешат на помошь 


Позиционные инициализаторы дают новую жизнь структурам, и в оставшейся 
части главы мы поговорим о том, что же можно делать с помощью структур теперь, 


' Заэто следует винить $6.7.8(3) стандарта 150 С, поскольку там чстко сказано, что масси- 


вы переменной длины инициализировать запрещастся. А мне так кажется, что компиля- 
тор должен был бы разобраться. 


к? 
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когда использовать их стало намного проще. Но сначала нужно определиться с 
форматом объявления. Я буду пользоваться таким форматом: 
бурейе# зегисЕ пемзЕгисе_ $ | 
іпе а, Ь; 
аоцЬ1е с, а; 
} пемзегисе_5; 


Здесь объявлен новый тип (пенз&гисе 5), совпадающий с типом структуры 
(ѕЕгисї пензе гисе $). Многие авторы выбирают разные имена для самой структуры 
и псевдонима ее типа ({уредеф), например: {уредеЕ зёгисі пз {... } пенѕігисї з;. 
Это совершенно необязательно: имена структур находятся в пространстве имен, 
отделенном от всех прочих идентификаторов (К&К, 2-е издание, 5 А8.3 (стр. 213); 
С99 и С11 $6.2.3(1)), поэтому никаких неоднозначностей для компилятора не воз- 
никает. Я считаю, что использование одного и того же имени не мешает и человеку, 
зато избавляет нас от необходимости изобретать еще одно соглашение об имено- 
вании. 

В стандарте РОЅІХ имена, оканчивающиеся суффиксом _, зарезервированы 
для типов, которые могут быть добавлены в стандарт в будущем. Формально стан- 
дарт С резервирует только имена 1... ё и џпі... ї, но в каждой новой версии 
появляются файлы-заголовки, в которых объявлены типы с именами, оканчиваю- 
щимися на Ё. Многие авторы не задумываются о конфликтах имен, которые 
могут возникнуть в их программах с выходом гипотетического стандарта С22, и 
беспечно называют свои типы именами, оканчивающимися на _(. Лично я в этой 
книге использую для структур имена с суффиксом з. 

Структуру этого типа можно объявить двумя способами: 


пензЕгисе_$ п5$1; 
збгоисі пемзегисе_$ 152; 


Есть несколько случаев, когда необходимо использовать форму ѕїгисі 

пенѕігосЕ 5 вместо пенѕігоисі 5. 
О Если структура включает элемент определяемого типа. Например, в струк- 
туре связанного списка может быть поле пехї, являющееся указателем на 


другую такую же структуру: 


СуредеЁ зЕгисЕ пемѕігисі з { 
іп а, Ы; 
аоор1е с, а; 
ѕігис пемѕёгосі ѕ *пехі; 
} пемѕёгисі 5; 


О В стандарте С11 требуется, чтобы анонимные структуры объявлялись 
ввиде ѕігисі пемѕігисе ѕ. Мы еще вернемся к этому вопросу в разделе «С без 
зазоров» ниже. 

О Некоторые просто любят формат ѕїгисі пенѕігис 5$, и это подводит нас к во- 
просу о стиле. 
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К вопросу о стиле 


Я с удивлением узнал, что многие считают, будто псевдонимы типов только за- 
путывают программу. Вот, например, цитата из руководства по стилю програм- 
мирования ядра [іпих: «Как понять, что могло бы означать объявление урз_ба;, 
встречающееся в исходном коде? Но если вы видите объявление ѕёгисі уігіџа1 _ 
сопёаіпег *а;, то сразу понятно, что такое а». На это замечание можно привести ес- 
тественное возражение: проясняет код более длинное имя – даже оканчивающее- 
ся словом сопѓаіпег, – а не ключевое слово ѕігисі в начале. 

Но у такого неприятия ќурейе должны же быть какие-то корни. При более при- 
стальном исследовании обнаружились исходные файлы, в которых псевдонимы 
типов рекомендовалось использовать для определения единиц измерения, папри- 
мер: 
суреде? аочЬ1е іпсһеѕ; 
суреде? адочЬ1е тебегѕ; 


іпсһеѕ 1Іепдёһі1; 
пеёегѕ Іепдёһ2; 


Теперь приходится при каждом использовании типа іпсћһеѕ вспоминать, что же 
это такое на самом деле (ипѕідпеа іпі? йоџр1е?), и при этом мы даже не получаем 
никакой защиты от ошибок. Где-нибудь через сотню строку, написав такое при- 
сваивание: 


Іеп9ёһ1 = 1Іепдһ2; 


вы уже позабыли о том, как ловко определили типы, а типичный компилятор Си 
не подумает предупредить вас об ошибке. Если вас заботят единицы измерения, 
укажите их прямо в имени переменной, и тогда ошибка станет очевидной: 


4оур1е 1Іепдёһ1 іпсһеѕ, Іепдёһ2 тебегѕ; 
// спустя 100 строчек: 


Іепдёћ1 іпсһеѕ = 1епдһ2 тебегѕ; // в этой строке очевидная ошибка 


Использовать глобальные псевдонимы типов, внутреннее устройство которых 
должно быть известно пользователю, имеет смысл настолько же редко, насколько 
и прочие глобальные элементы, потому что на поиск их объявления приходится 
отвлекаться точно так же, как на поиск объявления переменной, а это означает, 
что привносимая ими структуризация сводится на нет когнитивной нагрузкой на 
читателя программы. 

При всем при том практически в любой реальной библиотеке широко использу- 
ются псевдонимы типов для глобальных структур. Например, в С5Г. мы встречаем 
ќуредеРы 951 тесїоги 951 паёг1х, ав СІ1Ь - (уредеРы для хэшей, деревьев и прочих 
объектов. Даже в исходном коде СЁ написанной Линусом Торвальдсом системе 
управления версиями для ядра Глпих есть несколько стратегических (уре4еРов 
для структур. 
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Область видимости псевдонима типа такая же, как для любого объявления. Это 
означает, что можно определить (урейеЁвнутри файла, не боясьзасорить простран- 
ство имен вне этого файла. Бывают даже случаи, когда разумно определить (урейеѓ 
внутри одной функции. Вероятно, вы заметили, что большинство встречавшихся 
в книге суредеРов были локальными, то есть для поиска определения читателю 
достаточно просмотреть несколько предыдущих строчек, а немногие глобальные 
(тоесть определенные в каком-то включаемом заголовке) суре4еРы тем или иным 
способом обернуты, так что читателю их определение вообще неинтересно. Таким 
образом, можно избежать когнитивной нагрузки. 


Возврат нескольких значений из функции 


Областью значений математической функции может быть не только одномерное 
пространство. Так, вполне обычны функции, значениями которых являются точки 
на двухмерной плоскости (х, у). 
Руёћоп (и многие другие языки) позволяет возвращать несколько значений 
с помощью списков, например: 
# Вернуть ширину и высоту листа бумаги одного из стандартных форматов 
её міаєћ Іепдёһ (рарегёуре) : 
1Е (рарегкуре=="А4") : 
гебигп [210, 297] 
іЁ (рарегёуре=="Іеёбег") : 
геёоцгп [216, 279] 
1Ё (рарегёуре=="Іеда1") : 
геёоцгп [216, 356] 


[а, Б] = міаєћһ Іепаёһ ("А4"); 
ргіпё ("ширина=%і, высота=%1"% (а, Ь)) 


В С можно вернуть структуру, а стало быть, столько элементов, сколько необ- 
ходимо. Именно поэтому я так восхищался возможностью создавать одноразовые 
структуры: сгенерировать структуру для одной конкретной функции совсем не 
сложно. : 

Но взглянем правде в глаза: С в этом отношении все еще более многословен, 
чем языки, имеющие специальный синтаксис для возврата списков. Однако, как 
показано в примере 10.8, вполне возможно ясно выразить тот факт, что функция 
возвращает значение из К. 


Пример 10.8 * Если функция должна возвращать несколько значений, 
возвращайте структуру (рарегзте.с) 
#1пс]1и4е <5%41о.1> 


#1пс1и4е <ѕёгіпдѕ.һ> //зЕгсазестр (из РОЅІХ) 
#1пс1а4е <таєћ.һ> //Мам 


фуредеЕЁ ѕігосё { 
аоџЬ1е міаёћ, һеідһі; 
} ѕіте 5; 
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512е_5 міаєћ ћһеідһё (сһаг *рарегкуре) { 


геогп 
!ѕігсаѕестр (рарегіуре, "А4") ? (512е_5$) {.міаєћ=210, .һеідһе=297} 
!ѕігсаѕестр (рарегеуре, "Іеёбег") ? (ѕіге 5) {.міаєһ=216, .Һеідһе=279} 
!ѕЕгсаѕеспр (рарегёуре, "Іеда1") ? (5і2е 5) ({.міаєһ=216, .һеідһёЕ=356} 
(ѕі2е 5) {.міаєћ=МАМ, .Һеідһе=МАМ); 
} 
іп ма1п() { 


512е_$ а4ѕіғе = міаћ Һеідһе ("а4"); 
ргіпеЁ ("ширина=%9, высота=%9\п", а45іге.міаёћһ, а4ѕігғе.һеідһі); 


г у В этом примере используется конструкция условие ? если истина : иначе, представляю- 

У щая собой одно выражение, которое, следовательно, может встречаться сразу после 
гегигп. Обратите внимание, как элегантно эта последовательность позволяет перечис- 
лить все случаи (в том числе и последний, соответствующий всем остальным форматам). 
Я люблю таким образом оформлять небольшие таблицы, но есть люди, которые находят 
подобный стиль отвратительным. 


Альтернативный способ — использование указателей — часто встречается и не 
считается дурным тоном, но при этом бывает трудно понять, какие параметры 
входные, а какие – выходные, так что вариант с дополнительным суредеё стили- 
стически выглядит предпочтительнее: 


// И высота, и ширина возвращаются по указателям: 
уоіа міаєћ һеідһё (сһаг *рарегёуре, доџЬ1е *міаёһ, доџр1е *ћеідһё); 


// Ширина возвращается непосредственно, а высота – по указателю: 
4оуЬ1е міаёћһ ћһеідһё (сһаг *рарегіуре, ЧочЬ1е *Һеідһі); 


Извешение об ошибках 


В работе [СоойіЌе 2006] обсуждаются различные способы возврата из функции 
кода ошибки. Автор оценивает варианты довольно пессимистически. 

О Иногда можно выделить специальное значение, обозначающее ошибку, на- 
пример –1 для целых или МаМ для чисел с плавающей точкой (однако не- 
редки и случаи, когда допустимые возвращаемые значения занимают весь 
доступный диапазон). 

О Можно поднимать глобальный флаг ошибки, но в 2006 году Гудлиф еще 
не мог рекомендовать использовать для этой цели ключевое слово ТВгеад_ 
10са1, появившееся только в стандарте С11 и обеспечивающее корректную 
работу в многопоточных программах. Хотя в общем случае глобальный 
для всей программы флаг ошибки неприемлем, несколько тесно связанных 
между собой функций вполне могут совместно пользоваться переменной 
типа Тһгеай 10са1 в области видимости файла. 

О Третий вариант – «возвращать значение составного типа (кортеж), содер- 
жащеее как собственно возвращаемое значение, так и код ошибки. В попу- 
лярных С-подобных языках это выглядит довольно громоздко и встречает- 
ся редко». 
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Как мы уже видели в этой главе, у возврата структур есть много достоинств, 
а современные версии С предлагают целый ряд средств (псевдонимы типов, по- 
зиционные инициализаторы) для борьбы с громоздкостью. 
г ) При разработке каждой новой структуры подумайте, нет ли смысла предусмотреть в ней 


поле еггог или ѕіаїиѕ. Тогда при возврате такой структуры из функции у вас уже будет 
встроенный способ сообщить, является результат правильным или ошибочным. 


м 


В примере 10.9 уравнение из элементарного курса физики оформлено в виде 
функции, которая отвечает на вопрос «какую энергию приобретет идеальный объ- 
ект заданной массы после свободного падения на землю в течение заданного коли- 
чества секунд?» и при этом проверяет ошибки. 

Я заготовил несколько макросов, потому что, согласно моим наблюдениям, 
многие используют макросы в С прежде всего для обработки ошибок, наверное, 
потому что пикто не хочет, чтобы проверка ошибок отвлекала от основной задачи 
алгоритма. 


Пример 10.9 + Если нужно вернуть значение и код ошибки, воспользуйтесь 
структурой (еггоцир!е.с) 


#іпс10џде <5ѕаіо.һ> 
#1пс1и4е <таєһ.һ> //Мам, ром 


#деїіпе таке егг 5 (іпёуре, ѕһогёпате) \ © 
фуредеЁ зегисе { \ 
іпёуре уа1ие; \ 
сһаг соп$Е *еггог; \ © 
} зпогепате##_ егг_3; 


паке егг_$ (аоџр1е, аочЬ1е) 
паке егг_$ (11%, 116) 


паке егг_$(спаг *, ѕёгіпд) 


доџр1е егг ѕ Егее_Ёа1] епегду (доџр1е біте, Яоџр1е птаѕѕ) { 


аоџр1е егг ѕ оџё = {}; //іпібіа1іге бо а11 2егоз. 
оџё.еггог = біте < 0 ? "время отрицательно" 
: таѕѕ < 0 ? "масса отрицательна" © 


: іѕпап(ёіте) ? "время МаМ" 
: іѕпап (таѕ5) ? "масса Мам" 
: МОШ; 
1Е (оце.еггог) гебигп оці; © 


аоџр1е уе1осіёу = 9.8*Е1те; 
ОцЁЕ.уа1ие = мазз*ром (уе1осіїу, 2) /2.; 
геіигп ооё; 


} 


#адеѓіпе Сһеск егг (сһескте, гееигп_уа1) \ © 
1Е (сһескте.еггог) {Ёрк1п Е (зЕ4егг, "еггог: %5\п", срескме.еггог); \ 
гебигп геёџгп уа1; } 


106 таіп() { 
ЧоцЬ1е поёіте=0, Ёгасііоп=0; 
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Ӣоџр1е егг ѕ епегду = Ёгее Ға11 епегду(1, 1); © 

Сһеск_егг (епегду, 1); 

ргіпёЁ ("Епегду аЁёег опе ѕесопа:%9 ЈоџІеѕ\п", епегду.уа1ие); 

епегду = Ёгее Ға11 епегду(2, 1); 

Сһеск егг (епегду, 1); 

ргіпё# ("Епегду аЁёег мо ѕесопаѕ:%9 Јоџ1еѕ\п", епегду.уаіџе); 
епегду = Ёгее Ға11 епегду (по{1те/ЁгасЕ1оп, 1); 

Сһеск_егг (епегду, 1); 

ргіпёЁ ("Епегду аЁёег 0/0 ѕесопаѕ:%9 Јоџ1еѕ\п", епегду.уа1џе); 


© Если вам по душе идея возвращать кортеж «значение-ошибка», то понадобится 
отдельный тип для каждого типа возвращаемого значения. Поэтому я решил 
написать макрос, который позволит без труда порождать тип кортежа, соответ- 
ствующий базовому типу. Чуть ниже показано его применение для генерации 
типов доџр]е егг $, ілі егг $ и ѕігіпд егг 5. Если вы считаете этот трюк излиш- 
ним, можете им не пользоваться. 

Ө Почему бы не кодировать ошибки строками, а не целыми числами? Сообщения 
об ошибках обычно представляют собой константные строки, поэтому проб- 
лем с управлением памятью не возникнет, а в результате не нужно будет искать 
определение загадочного элемента перечисления. См. обсуждение в разделе 
«Перечисления и строки» выше. 

© Еще одна таблица возвращаемых значений. Это типичная проверка входных 
параметров функции. Обратите внимание, что элемент оп .еггог указывает на 
одну из литеральных строк. Поскольку строки не копируются, не нужно ни вы- 
делять, ни освобождать память. Чтобы подчеркнуть этот момент, я объявил ука- 
затель на сһаг сопѕі. 

Ө Или можно воспользоваться макросом $їорії, который описан в разделе «Про- 
верка ошибок» на стр. 78: орі (ой .еггог, гебигп оцё, оџё.еггог). 

© Макросы для проверки возвращенного функцией значения — стандартная 
идиома С. Поскольку ошибка представлена строкой, макрос может вывести ее 
на $6 4егг (или в журнал ошибок) непосредственно. 

© Порядок применения вполне ожидаемый. Авторы часто сетуют, что пользова- 
тель легко может не обратить внимания на то, что функция вернула код ошиб- 
ки, и вэтом отношении включение выходного значения в кортеж служит непло- 
хим напоминанием о том, что результат содержит и код ошибки, который нужно 
принимать во внимание. 


Гибкая перелача аргументов функциям 


Функции могут принимать переменное число аргументов (иногда такие функции 
называют вариадическими). Самый известный пример – функция ргіпі?, для ко- 
торой оба обращения – рг1пЕЁ("Н1.") и резп(Е ("%Е%#9%1\п", Вузе, зесопа, (№1г9) – 
допустимы. 

Если говорить упрощенно, то механизм функций с переменным числом аргу- 
ментов достаточен для реализации ргіліѓ, и на этом его возможности исчерпы- 
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ваются. Обязательно должен присутствовать первый фиксированный аргумент, 
и обычно ожидается, что этот первый аргумент дает возможность узнать типы 
или хотя бы число последующих аргументов. В примере выше первый аргумент 
("31%Е%1\п") говорит, что далее ожидаются еще два аргумента с плавающей точ- 
кой, а последний аргумент должен быть целым числом. 

Ни окакой типобезопасности и речи нет: если вы передадите число типа 11%, на- 
пример 1, вместо ожидаемого числа типа Поа, например 1.0, то результат не опре- 
делен. Если функция ожидает получить три аргумента, а передано только два, то, 
скорее всего, дело закончится нарушением защиты памяти. Из-за подобных проб- 
лем СЕКТ, группа по изучению безопасности программного обеспечения, считает 
функции с переменным числом аргументов небезопасными (степень опасности: 
высокая, шансы: вероятна)\. 

Мы уже видели, как можно в какой-то мере обезопасить функции с перемен- 
ным числом аргументов одного и того же типа: написать макрос-обертку, который 
дописывает завершающий элемент в конец списка, гарантируя тем самым, что 
обернутая функция не получит незавершенного списка. Составной литерал про- 
веряет также типы входных параметров и не будет компилироваться, если передан 
параметр не того типа. 

В этом разделе мы рассмотрим еще два способа реализации функций с пере- 
менным числом аргументов, поддерживающих проверку типов. Последний способ 
позволяет именовать аргументы, что также до некоторой степени уменьшает веро- 
ятность ошибки. Я согласен с СЕКТ в том, что неконтролируемое использование 
функций с переменным числом аргументов слишком опасно, и в своих програм- 
мах пользуюсь только описанными ниже частными случаями. 

Первый способ основан на том, что компилятор умеет проверять аргументы 
ре1пЕЁ, а второй – на использовании макросов с переменным числом аргументов 
для подготовки входных параметров к применению синтаксиса позиционных 
инициализаторов в заголовках функций. 


Объявление своей функции по аналогии с рип 


Для начала исследуем традиционный путь и воспользуемся средствами под- 
держки функций с переменным числом аргументов, описанными в стандарте 
С89. Я останавливаюсь на этом, потому что бывают ситуации, когда макросами 
воспользоваться невозможно. Обычно они обусловлены психологическими, а не 
техническими факторами - мало найдется случаев, когда функцию с переменным 
числом аргументов нельзя было бы заменить макросом с переменным числом ар- 
гументов, воспользовавшись одним из рассмотренных в этой главе подходов. 
Чтобы сделать функцию с переменным числом аргументов, отвечающую стан- 
дарту С89, безопасной, нам понадобится расширение, впервые предложенное 
в сс, но впоследствии широко поддержанное другими компиляторами: ключевое 
слово _ а гие _, открывающее доступ к различным зависящим от компилято- 
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ра трюкам'. Оно должно находиться в строке объявления переменной, структуры 
или функции (поэтому если ваша функция не определена до использования, то 
придется ее определить). 

Допустим, требуется версия функции ѕуѕѓет, принимающая аргументы так же, 
как ргіпёғ. В примере 10.10 показана функция зуз{ет и ре1п(Ё, которая принимает 
аргументы в духе ргіпёї, записывает их в строку и передает результат стандартной 
функции зуз*ет. В ней используется функция уазрг1п"Ё — вариант аѕргіпёѓ, умею- 
щий работать с уа 115. Обе эти функции описаны в стандартах ВЅр и СМ. Если 
требуется строго придерживаться стандарта С99, замените уазрг1п{ЁР функцией 
узпри1п Е, являющейся аналогом ѕпргіпіѓ (и добавьте директиву #іпс1џде <з&9ага.|>). 

Функция па1п просто демонстрирует порядок применения: она берет первый 
аргумент из командной строки и подает его на вход команды 15. 


Пример 10.10 * Старомодный способ обработки списков аргументов переменной 
длины (о!еп_уагага$.с) 


#Аейпе СМО ЗО0ВСЕ //чтобы 5410.1 включал уазрг1пЕЁ 
#іпс1оаӢе <${41о.В> //рг1пЕЁ, маѕргіпіѓ 

#іпс1џае <з&Ч4агд.В> //уа ѕбаге, уа епа 

#іпс1іџдӢе <ѕЕа1ір.һ> //ѕуѕёет, Ёгее 

#1пс1и4е <аѕѕегіё.һ> 


іп ѕзуѕзќет и ргіпёё (сһаг соп * Ёт, ...) __аёсгіриёе _ \ ® 
((Ғогтаё (ргіпё#,1,2))); 


іп ѕуѕёет м ргіпЄЁ (сһаг сопѕё *Ёті, ...) { 
сһаг *ста; 
уа _1іѕё аг9р; 
уа _ѕСагі (агдр, Ёмё); 
уазрг1 п (&ста, ётё, агар); 
уа _епа (агодр); 
іпё оцё= ѕуѕёет (ста); 
Ғгее (ста); 
геёџгп оц; 


} 


іп таіп (іп агдс, сһаг **агду) { 
аѕѕегі (агас == 2); 9 
геёцгп ѕуѕёет м ргіпе# ("15%5", агду[1]); 


} 


' Если вас беспокоит, что у пользователя может оказаться компилятор, пе поддерживаю- 


щего ключевого слова аїѓгіриїе _, то в Ашоюо[ найдутся средства утешить вас. Из- 
влеките из архива АиќосопЁ макрос АХ_С__ АТТВІВОТЕ и вставьте его в файл асюса|т4 
в каталоге проекта. Добавьте вызов АХ С_ АТТАІВОТЕ в файл сопйриге.ас, а потом с по- 
мощью препроцессора определите пустой символ аще в случае, когда Ашіосопѓ 
выясняет, что компилятор не поддерживает этого ключевого слова. Это деластся так: 
#іпс1џдӢе "сопйа. в" 

#1Еп4еЕ НАУЕ___ АТТВТВОТЕ __ 

#АеНте __абёгірџёе (...) 

#епаіғ 
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© Помечает эту функцию как ргіпіё-подобную, сообщая компилятору, что первый 
параметр - это спецификатор формата, а список дополнительных параметров 
начинается со второго. 

Ө Сознаюсь – тут я поленился. Необернутый макрос аѕѕегї следует использовать 
только для проверки значений, напрямую контролируемых автором, но не для 
данных, полученных от пользователя. Макрос, пригодный для проверки вход- 
ных параметров, приведен в разделе «Проверка ошибок» выше. 


Единственный плюс этого подхода, по сравнению с макросом с переменным 
числом аргументов, — громоздкость получения от макроса возвращенного значе- 
ния. Однако версия из примера 10.11 на основе макроса короче и проще, и если 
компилятор поддерживает проверку типов аргументов для функций из семейства 
ре1пЕЁ, то эта поддержка будет автоматически работать и здесь (без использования 
специфичных для 5сс и С|апр атрибутов). 


Пример 10.11 + Версия с использованием макроса, имеющая меньше 
зависимостей (тасго_уагагд$.с) 


#АеНпе СМО ЅО0АСЕ // чтобы ѕаӢіо.Һ включал уаѕргіпёЁ 
#1пс1и4е <5аіо.һ> //рг1пЕЁ, уазрг1пЕЁЕ 

#іпс1џдӢе <56а1ір.Һ> //5узёет 

#іпс1џае <аѕѕегё.һ> 


#Аейпе бузеет_ м ргіпбё (оџёуа1, ...) {\ 
сһаг *5%&г1па_Ёог_зузеемЁ; \ 
аѕргіпіЁ (&356г1п9_Еог_зузеетЁ, __УА_АВС$ _); \ 


оџбуа1 = зузёет (5©гіпд Ёог ѕуѕќетё); \ 
Егее (5ігіпд Ғог ѕузёетЁ); \ 


} 


іп ма1п (іпе агас, сһаг **агду) { 
аѕѕегі (агдс == 2); 
116 оџё; 
Ѕузсет м ргіпё# (ое, "15%5", агду[1]); 
геёигп оцЕ; 


} 


Необязательные и именованные аргументы 


Я уже показывал, как передать функции список однотипных аргументов с по- 
мощью комбинации составного литерала и макроса с переменным числом аргу- 
ментов (см. раздел «Безопасное завершение списков» выше в этой главе). 

Структура во многих отношениях аналогична массиву, только позволяет хра- 
нить данные разных типов. А раз так, то можно применить ту же самую схему: 
написать макрос-обертку для упаковки элементов в структуру, а затем передать 
эту структуру функции. В примере 10.12 показано, как это делается. 

Макрос собирает воедино функцию, принимающую переменное число имено- 
ванных аргументов. Определение функции состоит из трех частей: одноразовой 
структуры, к которой никогда не обращаются по имени (однако оно все равно за- 
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соряет глобальное пространство имен, если функция глобальна); макроса, кото- 
рый вставляет свои аргументы в структуру, которая затем передается обертывае- 
мой функции, и самой обертываемой функции. 


Пример 10.12 * Функция, принимающая переменное число именованных 
аргументов, - аргументы, не заданные пользователем, будут иметь значения 
по умолчанию (іаеаі.с) 

#іпс1џае <ѕёаіо.һ> 


суреаеЕ зегисе { © 
аоџр1е ргеззиге, то]еѕ, Ёетр; 
} ійеа1 эігисіё; 


/** Найти объем (в кубических метрах), занимаемый идеальным газом, 
который подчиняется закону \У=пКТ/Р 
Входные параметры: 
давление в атмосферах (по умолчанию 1) 
молярный объем вещества (по умолчанию 1) 
температура в градусах Кельвина (по умолчанию температура замерзания воды = 273.15) 
*/ 
#Чейле 1Ч4еа1_ргеззиге(...) 14еа1_ргеззиге_разе ( (14еа1_з&гис®) \ Ө 
{.ргеѕѕиге=1, .то1ез=1, .Ёетр=273.15, __\УА_АВС$ __}) 


аоџр1е 14еа1_ргеззиге_разе (ійеа1 зігисї іп) { Ө 
геіцгп 8.314 * іп.то1еѕ*іп.ёетр/іп.ргеѕѕиге; 


} 


11 таіп() { 
рг1пЕЁ ("объем с параметрами по умолчанию: %9\п", 14еа1_ргеззиге() ); 
рг1пЕЁ ("объем при температуре кипения: %9\п", 
ійеа1 ргеззиге (.їетр=373.15) ); ® 
ргіпеЁ ("объем двух молей вещества: %9\п", ійеа1 ргеззиге (.по1ез=2) ); 
ргіпеЁ ("объем двух молей вещества при температуре кипения: %9\п", 
іаеа1 ргеѕзиге (.то1еѕ=2, .ёетр=373.15) ); 


} 


© Прежде всего необходимо определить структуру, содержащую выходные аргу- 
менты функции. 

Ө Входные параметры макроса подставляются в определение анонимной струк- 
туры, причем аргументы, поставленные пользователем в скобках, станут пози- 
ционными инициализаторами. 

Ө Сама функция принимает структуру 14еа1 ѕїгисі, а не список независимых ар- 
гументов, как обычно. 

Ө Пользователь задает список позиционных инициализаторов. Аргументы, пе 
указанные явно, принимают значения по умолчанию, после чего функции 
ійеа1 ргеззиге Базе передается входная структура, содержащая все необходи- 
мое. 


Вот как расширяется вызов функции в последней строке (не говорите пользо- 
вателю, что на самом деле это макрос): 
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1Чеа1 ргеззиге_Ъазе ( (ійеа1 ѕігосї) {.ргеззиге=1, .то1ез=1, .ёетр=273.15, 
.то1еѕ=2, .ёетр=373.15}) 


Общее правило состоит в том, что если некоторое поле инициализируется не- 
сколько раз, то предпочтение отдается последней инициализации. Поэтому поле 
.ргеѕѕиге будет иметь значение по умолчанию, тогда как остальные два входных 
параметра – значения, заданные пользователем. 


^ В Сіапо повторная инициализация полей по1еѕ и {епр приводит к предупреждению, если 
р | \ задан флаг -а11, поскольку авторы компилятора сочли, что двойная инициализация ско- 
рее свидетельствует об ошибке, чем о сознательном задании значений по умолчанию. 
Чтобы отключить это предупреждение, добавьте флаг -Ипо1п1{1а112ег-оуегг14ез. дсссчи- 
тает такую ситуацию ошибкой, толькоеслиявно задан флаг -Йехіга нагпіпдѕ; чтобы в таком 
режиме отключить это конкретное предупреждение, добавьте флаги -Нехіга -Моуегг1ае- 
іпіё. 
"} Ваша очередь. В данном случае одноразовая структура, быть может, и не такая уж одно- 
разовая, потому что имеет смысл применять формулу в различных направлениях: 
• давление = 8.314 моля * температура / объем; 
• моль = давление * объем / (8.314 температура); 
• температура = давление * объем /(8.314 моля). 
Переделайте структуру, добавив в нее поле объема, и, пользуясь одной и той же структу- 
рой, напишите функции для этих дополнительных уравнений. 
Затем с помощью этих функций напишите унифицированную функцию, которая принима- 
ет структуру с тремя заполненными полями из четырех (четвертое может содержать Мам, 
или, если хотите, можете добавить в структуру поле ићаї +0 501че) и, применяя нужное 
уравнение, заполняет четвертое поле. ГИ 


Теперь, когда все аргументы необязательны, вы можете вернуться к этой функ- 
ции через полгода и добавить новый аргумент, не «поломав» программ, в которых 
она используется. Можно начать с простейшей работоспособной функции и по 
мере необходимости добавлять новые возможности. Однако не стоит забывать об 
уроках языков, в которых эта возможность была с самого начала: очень легко ув- 
лечься и начать писать функции с десятками параметров, каждый из которых не- 
обходим для обработки каких-то необычных случаев. 


Доведение до ума бестолковой функции 


До сих пор мы демонстрировали простые конструкции, не требующие значитель- 
ных усилий от программиста, однако короткие примеры не могут охватить все 
приемы, применяемые для объединения разрозненных частей в полезную и на- 
дежпую программу для решения реальной задачи. Поэтому в дальнейшем приме- 
ры будут усложняться и учитывать более реалистичные условия. 

В примере 10.13 приведена бестолковая и неприятная функция. В случае ссу- 
ды, погашаемой в рассрочку, ежемесячные платежи фиксированы, но часть ссуды, 
уходящая на погашение процентов, в начале (когда заемщик еще много должен) 
гораздо выше и уменьшается до нуля в конце срока. Вычисления довольно уто- 
мительны (особенно если добавляется возможность вносить ежемесячные допол- 
нительные платежи для погашения основной суммы или досрочно погасить всю 
ссуду), так что читателя, который захочет пропустить детали, можно извинить. 
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Интерес для нас представляет интерфейс, в котором 10 параметров перечисляют- 
ся в некоем произвольном порядке. Применение этой функции для финансовых 
расчетов сопряжено с трудностями и чревато ошибками. 

Таким образом, апогііғе – яркий пример многочисленных унаследованных 
функций, написанных на С за долгие годы. Панк-роком она является только в том 
смысле, что демонстрирует полнейшее презрение к публике. Поэтому, следуя 
стилю глянцевых журналов, мы в этом разделе нарядим эту функцию в яркую 
обертку. Если это унаследованный код, то мы не вправе изменять интерфейс са- 
мой функции (потому что от него могут зависеть другие программы), поэтому 
в дополнение к процедуре генерации именованных необязательных параметров, 
использованной в примере с уравнением идеального газа, нам понадобится про- 
межуточная функция для наведения моста между результатом работы макроса и 
фиксированным набором входных аргументов унаследованной функции. 


Пример 10.13 * Трудная для использования функция, у которой слишком много 
входных аргументов и нет проверки ошибок (ато {те.с) 


#1пс]и4е <таёћ.һ> //ром 
#1пс1и4ае <з&41о.1> 
#іпс1џае "атогёіғе.һ" 


аоџр1іе атогіізе (аоџр1іе атё, Яоџр1е гае, аочЬ1е іпћаёіоп, іпё топёећѕ, 
іп ѕе110## мопЕН, доџр1е ехега_рауоЁЁ, іпі уегроѕе, 
аоџр1е *іпбегеѕі ру, ЧоцЮ1е *аџцгаѓіоп, 
доџр1е *топЕћ1у раутепё) { 
ЧоцЬ1е Соба] іпбегеѕі = 0; 
*іпбегеѕі ру = 0; 
доџр1е тгаёе = гаёе/1200; 


// Месячный платеж фиксирован, но доля, уходящая на выплату процентов, 
// меняется. 
*топЕћ1у раутепё = ате * тгаќе/ (1-ром (1+тгаёе, -топёћѕ)) + ехёга_рауоЁ{; 
1ЁЕ (уегроѕе) ргіпіё ("Ваш общий ежемесячный платеж: $%9\п\п", 
хпопЕћ1у раутепі); 
іпе епа топёћ = (ѕе110## топёћ && ѕе110## мопЕН < топЕћѕ ) 
? зе11оЕЁЁ топёћ 
: топёћѕ; 

іЁ (уегрозе) 

ре1пЕЁ("уг/топ\Е Рг1пс.\Е\ЕТпе.\ | РУ Ргіпс.\ РУ Тпё.\Е Вабіо\п"); 
іп т; 
Ғог (п=0; м < епа топёћ && ате > 0; т++) { 

аоџр1е іпіегеѕ раутепё = аті*тгасе; 

Ӣоџр1е ргіпсіра1 раутепї = *топЕВ1у_раутепЕ - іпёегеѕі раутепі; 

1Е (ат <= 0) 

ргіпсіра1 раутепе = 
іпсегеѕіё раутепі = 0; 

апі -= ргіпсіра1 раутепё; 

аоџр1е деПаёог = ром (1 + іпПаёіоп/100, -м/12.); 

*іпёегеѕё ру += іпбегеѕї раутепе * Яећаѓог; 

Соба1 іпёегеѕі += іпёегеѕё раутепі; 

1Е (уегроѕе) ргіпё# ("%1/%1\0%7.2 #\\0%7. 2\6 17. 22\0%7.2\0%7.28\п", 
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т/12, м-12* (п/12)+1, ргіпсіра1 раутепё, іпіегеѕё раутепё, 
ргіпсіра1 раутепё* деПаёог, іпбегеѕё раутепе*іећаїог, 
ргіпсіра1 раутепё / (ргіпсіра1 раутепі+іпёегезі раутепё) *100); 

} 

*ацгабіоп = п/12.; 

гебогп Софа] іпёегеѕі; 


В примерах 10.14 и 10.15 организуется удобный интерфейс к этой функции. 
Файл-заголовок содержит главным образом документацию в формате Оохувбеп, 
потому что входных параметров очень много, и было бы безумием оставить их не- 
документированными, а кроме того, пользователю необходимо сообщить, каковы 
будут значения по умолчанию для параметров, не заданных явно. 


Пример 10.14 + Файл-заголовок, включающий в основном документацию, 
а также макрос и заголовок промежуточной функции (атогїіге.ћ) 


аӢоџр1е атогііге (аоџр1е атё, йоџр1е гае, йоџр1е іпђаёіоп, іпі топёћѕ, 
іле ѕе110## топіћ, дӢоџр1е ехега_рауоЕЁ, ілі уегроѕе, 
доџр1е *іпёегеѕі ру, Яоџр1е *аџгаііоп, Яоџр1Іе *топёћіу раутепё); 


фуреаеЕ зегисе { 
оцБ1е атоипЕ, уеагѕ, гаке, $е11оЁЁ_уеаг, ехіга рауоѓ#, 1пПае1оп; © 
іпЕ топћѕ, зе11оЕЁ топеһ; 
_Воо1 зһом ѓЁар1е; 
Ӣоџр1е іпёегеѕіё, іпіегеѕі ру, топёћ1у раутепё, уеагѕ ёо рауоѓѓ; 
сһаг *еггог; 
} атогёігаїіоп $; 


/** Вычислить скорректированную с учетом инфляции величину процентов, © 
уплачиваемых в течение срока предоставления ссуды, например ипотечного 
кредита. 


\11 \с атоџпі Размер ссуды в долларах. Значения по умолчанию нет--если 

| не задан, печатается сообщение об ошибке и возвращаются нули. 

\11 \с мопЁВ$ Количество месяцев, на которое выдана ссуда. По умолчанию: 

нуль, однако см. параметр уеагз. 

\11 \с уеагз Если параметр топёһћѕ не задан, то можно задать количество лет. 

Например, 10.5=десять лет и шесть месяцев. По умолчанию: 30 
(типичный срок ипотечного кредитования в США). 
\11 \с гае Процентная ставка в годовом исчислении. По умолчанию: 4.5 
(то есть 4.5%), типичная ставка для рынка ипотечного кредитования 
США в 2012 году. 

\11 \с 1пЙаё1оп Процентный уровень инфляции за год, используется для 
расчета стоимости денег. По умолчанию: 0, то есть поправка 
на инфляцию отсутствует. В последние несколько десятков 
лет для США характерно значение в районе 3. 

Аб зе11оЕЕ мопЕВ В этот месяц ссуда может быть выплачена полностью 

(например, если вы перепродали дом). По умолчанию: 0 
(то есть досрочное погашение не предусмотрено). 
\11 \с ѕе110## уеаг Если зе11оЕЕ топіћһ==0 и этот параметр положителен, то 
он определяет год досрочного погашения. По умолчанию: 0 
(то есть досрочное погашение не предусмотрено). 
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\11 \с ехёга_рауоЁЁ Дополнительный ежемесячный платеж для погашения основной 
суммы долга. По умолчанию: 0. 

\11 \с ѕһом баріе Если отличен от нуля, то выводится таблица платежей. Если 
равен 0, то не выводится ничего (просто возвращается 
общая сумма процентов). По умолчанию: 1. 


Все параметры, кроме \с ехЕга_рауоЁЁ и \с 1пНа®1оп, должны быть неотрицательны. 


\гебигп структура \с атогбіғаёіоп ѕ, в которой заполнены все вышеперечисленные поля, 
а также: 


\11 \с іпёегеѕі Общая сумма, уплачиваемая в качестве процентов. 
\11 \с іпёегеѕї ру Общая сумма уплачиваемых процентов с поправкой текущей 
стоимости на инфляцию. 

\11 \с попЕВ1у_раутепе Фиксированный ежемесячный платеж (в случае ипотечного 
кредита к нему добавляются налоги и проценты). 

\11 \с уеагѕ їо рауоё# Обычно срок предоставления ссуды или дата досрочного 
погашения, но если вы уплачиваете больше 
фиксированного платежа, то ссуда будет погашена 


раньше. 

\11 \с еггог Если <і>еггог != МЏОІ1</60>, значит, произошла какая-то ошибка 
и результаты недостоверны. 

*/ 

#АеЙпе атогііғаїіоп(...) атогёіге ргер ( (атогёіғгаїіоп ѕ) {.ѕћом ёар1е=1, \ 


__УА АВСЅ _}) [3] 
апогііғаііоп 5 атогііғе ргер (атогёіғабіоп ѕ іп); 


© Структура, с помощью которой макрос передает данные промежуточной 
функции. Она должна находиться в той же области видимости, что сам макрос 
и промежуточная функция. Некоторые поля не соответствуют параметрам 
функции апогііге, но упрощают работу пользователя. Часть полей заполняет- 
ся функцией. 

Ө Документация в формате Оохудеп. Хорошо, когда документация занимает 
большую часть интерфейсного файла. Обратите внимание, что для каждого 
входного параметра указано значение по умолчанию. 

Ө Этот макрос помещает введенные пользователем данные -— скажем, 
атог+ 12а 1оп (.атоџпё=2е6, .гаїе=3.0) – в позиционный инициализатор струк- 
туры апогїііғаїіоп ѕ. Мы задали здесь значение по умолчанию для пои ѓаБ]е, 
потому что иначе нельзя было бы отличить случай, когда пользователь явно 
установил .ѕћою ёар1е=0, от случая, когда параметр .ѕћом ќар1е вообще опущен. 
Таким образом, когда требуется задать отличное от нуля значение по умолча- 
нию для параметра, который допускает нулевое значение, то нужно использо- 
вать такую форму. 


Как и раньше, явственно видны три составные части механизма именованных 
аргументов: ќурейеЁ для структуры, макрос, который принимает именованные 
элементы и заполняет структуру, и функция, которая принимает эту структуру 
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в качестве параметра. Однако в данном случае вызывается промежуточная функ- 
ция, расположенная между макросом и обертываемой функцией. Ее объявление 
находится в заголовке, а определение показано в примере 10.15. 


Пример 10.15 < Закрытая часть интерфейса (атогі_іпіегїасе.с) 


#1пс1и4е "ѕіорі#.һ" 
#1пс1а4е <5аіо.һ> 
#іпс10џдӢе "атогбіғе.һ" 


атогбігасіоп 5 атогііге ргер (атогёігабіоп 5 іп) { © 
5$&ор1Ё(!1п.атоипЕ || іп.атоџпё < 0 || іп.габе < 0 ө 
|| іп.толећѕ < 0 || іп.уеагѕ < 0 || іп.ѕе110## топећ < 0 


|| іл.ѕе110#Ғ уеаг < 0, 
гебцгп (атогііғаііоп ѕ) {.еггог="Недопустимые входные данные"), 
"Недопустимые входные данные. Возвращаются нули."); 


116 топећѕ = іп.тмопёћз; 
іЁ (!топЕһ5) { 
1Е (іп.уеагѕ) топёһѕ = іп.уеагѕ * 12; 
е1ѕе топЕћѕ = 12 * 30; // ссуда по ипотечному кредиту 
} 
іп ѕе110## топёһ = 1п.5е11оЕЁ попеН; 
1Е (!зе11оЕЁ топећ && 1п.з3е11оЕЕ уеаг) 
зе11оЕЁ_топЕВ = іп.ѕе110## уеаг * 12; 


атогііғабіоп 5ѕ оџі = іп; 
оџё.габе = іп.габе ? іп.габе : 4.5; Ө 
ооцЕ.іпёегеѕі = атогіізе (іп.атоцпё, ооё. гае, іп. іпћаёіоп, 
топећѕ, ѕе110#Ғ мопЕП, 1п.ехЕга_рауоЁЁ, іп.ѕһом бар1е, 
& (оџЕ.іпёегеѕё ру), & (оџё.уеагѕ ѓо рауоѓЁ?), & (оџё.топЕћ1у раутепё)); 
геіигп оџё; 


} 


© Это промежуточная функция, которая должна была бы являться частью 
апогёіге: она устанавливает разумные нетривиальные умолчания и проверяет, 
нет ли ошибок во входных параметрах. После этого апогїіғе может сразу за- 
няться своим делом, поскольку вся подготовительная работа уже произведена. 

Ө Обсуждение макроса 5 ор1Ё см. в разделе «Проверка ошибок» на стр. 78. Как и 
там, проверка в этой строке обусловлена скорее желанием предотвратить нару- 
шения защиты памяти и удостовериться в разумности параметров, чем стрем- 
лением автоматизировать проверку всех возможных ошибок. 

Ө Поскольку это простая константа, мы могли бы установить уровень инфляции 
и в макросе апогііғаѓ1оп вместе со значением по умолчанию для эпом їађБ]е. Ре- 
шать вам. 


Основное назначение промежуточной функции - получить одну структуру 
и вызвать функцию апог\12е, передав ей в качестве параметров отдельные поля 
структуры, поскольку изменять интерфейс самой функции апог\12е мы не вправе. 
Но уж коль скоро мы завели функцию, предназначенную для подготовки вход- 


238 *% Часть 1. Язык 


ных параметров, то почему бы не проверить ошибки и не установить значения 
по умолчанию? Например, можно разрешить пользователю задавать временные 
промежутки в месяцах или в годах и возвращать из промежуточной функции код 
ошибки, если входные параметры выходят за границы допустимого диапазона или 
неразумны. 

Для подобных функций значения по умолчанию особенно важны, потому что 
большинство пользователей не знает (и не интересуется), каков разумный уро- 
вень инфляции. Если компьютер способен предложить пользователю знания 
о предметной области, которыми тот не располагает, и сделать это ненавязчиво, 
с помощью значения по умолчанию, которое легко переопределить, то вряд ли 
пользователь будет расстроен. 

Функция апогііғе возвращает несколько значений. Как сказано в разделе «Воз- 
врат нескольких значений из функции», вместо того чтобы возвращать одно зна- 
чение напрямую, а остальные – по указателям, удобно собрать все возвращаемые 
значения в одну структуру. Но чтобы комбинация позиционных инициализато- 
ров и макросов с переменным числом аргументов заработала, нам уже пришлось 
завести промежуточную структуру; так почему бы не объединить две структуры 
в одну? В результате мы получаем на выходе структуру, в которой сохранены так- 
же все входные параметры. 

Организовав такой интерфейс, мы получим хорошо документированную, прос- 
тую в использовании функцию с проверкой ошибок, и с помощью приведенной 
в примере 10.16 программы сможем без труда анализировать разнообразные си- 
туации. Эта программа собирается из файлов атог@2е.с и атот_ ітетјасе.с, причем 
в последнем используется функция рон из математической библиотеки, так что 
таке е выглядит следующим образом: 

Р=атог® _изе 

оБ)есЕз=атогЕ іпёегҒасе.о апогііге.о 
СЕ1Аб5=-9 -Ма11 -03 #һе оѕџа1 
101В$=-1т 


СС=с99 
$ (Р) :$ (орјесеѕ) 


Пример 10.16 + Сейчас мы можем воспользоваться макросом и функцией для 
расчета процентов по ссуде для моделирования различных ситуаций (атогї_иѕе.с) 


#1пс1и4е <51аіо.һ> 
#1пс]и4е "атогбігғе.һћ" 


1106 таіп() { 
ргіпіёЁ ("Типичная ссуда: \п"); 
атогіітзаёіоп ѕ пораутепёѕ = атогіігасіоп (.атоџпе=200000, .іпћабіоп=3); 
ргіпёЁ ("Вы спустили $%9 в унитаз, текущая стоимость займа $%9.\п", 
пораутепёѕ.іпсегеѕі, пораутепіѕ.іпбегеѕе ру); 


атогёіғабіоп ѕ а һоипагеа = атогіізаѓіоп (.атоџпё=200000, .іпћабіоп=3, 
.Ѕћом бар1е=0, „ехега_рауоЕЁ=100); 
ре1п& Е ("Выплачивая лишние $100 в месяц, вы потеряете только $%9 (РУ), " 
"и весь долг будет погашен через%д лет. \п", 
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а һопагеа.іпёегеѕі ру, а һопагеа.уеагѕ їо рауоѓ#); 


рг1п®Ё ("Погасив ссуду через десять лет, вы уплатите $%4 " 
"в виде процентов (РУ) .\п", 
атогіігабіоп (.атмоцпё=200000, .іпћаёіоп=3, 
.ѕһом бар1е=0, .зѕе110## уеаг=10).іпбегезі ру); Ф@ 
} 


© Функция апогіігаёіоп возвращает структуру, и в первых двух случаях мы при- 
своили ей имя и использовали поля именованной структуры. Но если проме- 
жуточная именованная переменная не нужна, то можно ее и не заводить. В этой 
строчке мы извлекаем из возвращенной структуры единственное поле. Если 
бы функция возвращала блок памяти, выделенный с помощью па11ос, то такой 
трюк не прошел бы, потому что переменную необходимо назвать, чтобы потом 
передать функции освобождения памяти. Однако в этой главе мы всюду пере- 
даем структуры, а не указатели на структуры. 


Обертывание исходной функции потребовало много строк кода, но стерео- 
типная структура и макросы для подготовки именованных аргументов занимают 
лишь малую их часть. Остальное — документация и предварительная обработка 
входных параметров, которую в любом случае имело смысл добавить. В итоге из 
функции с почти непригодным интерфейсом мы получили удобную для исполь- 
зования функцию, каким и должен быть кредитный калькулятор. 


Указатель на “оід и структура, на которую 
он указывает 


Этот раздел посвящен реализации обобщенных процедур и структур. В одном из 
рассматриваемых здесь примеров показано, как применить некоторую функцию 
к каждому файлу в иерархии каталогов; это может быть вывод имен файлов на 
экран, поиск строки и вообще все, что придет на ум пользователю. В другом при- 
мере мы воспользуемся структурой хэша из библиотеки СТАЬ для подсчета ко- 
личества отдельных символов, встречающихся в файле. Для этого придется ассо- 
циировать ключ в виде символа Опісойе с целочисленным значением. Разумеется, 
структура хэша в СІ1Ь допускает любые типы ключей и значений, так что подсчет 
символов Ошсо4е – это пример применения обобщенного контейнера. 

Этой гибкостью мы обязаны указателю на уо!4, который может указывать на 
все, что угодно. Функции хэширования и функции обработки каталогов безраз- 
лично, на что именно ведет указатель, они просто передают значения дальше. За- 
бота о типобезопасности ложится на программиста, но структуры помогают обес- 
печить ее и упрощают написание и использование обобщенных процедур. 


Функции с обобщенными входными параметрами 


Функцией обратного вызова называется функция, которая передается другой 
функции, чтобы та ее вызывала в подходящий момент. В данном случае нам нужно 
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рекурсивно обойти каталог и что-то сделать с каждым файлом. Для этой цели мы 
передаем процедуре обхода каталога функцию обратного вызова, применяемую к 
каждому файлу. 

Проблема изображена на рис. 10.1. Когда функция вызывается напрямую, ком- 
пиляторзнает типы фактических данных и типы параметров функции; если они не 
совпадают, то компилятор об этом сообщит. Но обобщенная процедура не должна 
диктовать формат функции или используемых в ней данных. В разделе «Библио- 
тека рһгеад» на стр. 307 рассматривается функция рїћгеай сгеаќе, которую (если 
опустить не относящиеся к делу детали) можно было бы объявить в таком виде: 
Сурейе? уоіа * (*уоіа рег ѓо уоіа рег) (уоіа *іп); 
іпё рећһгеаа сгеабе(..., уоіа *рег, уоіа ріг бо хоіа ріг Ёп); 


Ваш тип 
Входные данные 
Тип  уоій Обобщенная \014 > тип 


Рис. 10.1. Сравнение вызова функции напрямую 
и вызова из обобщенной процедуры 


Если вызвать ріћгеад сгеаѓе (..., іпдаѓа, пуЁџпс), то информация о типе іпіаѓа 
будет потеряна, потому что было выполнено приведение к указателю на ус. Где- 
то внутри ріћгеай сгеаќе производится обращение вида пуЁопс (іпіаќа). Если пере- 
менная 1пда{а имеет тип іоџр]е*, а пуѓџпс принимает сћаг*, то произойдет катастро- 
фа, которую компилятор не в силах предотвратить. 

В примере 10.17 приведен файл-заголовок, необходимый для реализации функ- 
ции, которая применяет некоторые функции к каждому каталогу и файлу внутри 
каталога. Включена документация в формате Юохувеп, описывающая, что должна 
делать функция ргосезз_41г. Как и полагается, длина документации примерно со- 
впадает с длиной самого кода. 


Пример 10.17 + Файл-заголовок для обобщенной функции обхода каталога 
(ргосез$_ай.П) 


ЗЕгисе Н1езекисе; 
буреде# уоіа (*1еуе1 Ёп) (з6гисЕ Н1езегисе раёп); 


суредеЁ ѕігисі Н1езЕгис* { 
сһаг *паме, *Ёџ11пате; 
1еуе1 Ёп дігесёогу асбіоп, е асііоп; 
106 аереһ, еггог; 
уоіа *ааба; 
} еѕігосі; © 


/** Получить содержимое заданного каталога, применить к каждому файлу 
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Функцию \с Не асѓііоп, а к каждому каталогу - функцию \с Яіг асііоп и рекурсивно 
посетить каталог. Отметим, что таким образом реализуется обход в глубину. 


Пользовательские функции принимают структуру \с Шезегисе. Отметим, что 
в ней имеется поле \с еггог, в которое можно записать 1 для индикации ошибки. 


Входными параметрами являются позиционные инициализаторы. Допустимы 
следующие параметры: 


\11 \с .пате Имя текущего файла или каталога 

\11 \с .#џ11пате Путь к текущему файлу или каталогу 

\11 \с .дігесіогу асііоп Функция, принимающая \с #1еѕігосі. 
При вызове этой функции ей передается правильно заполненная 
структура \с Н1езегисЕ для каталога (она вызывается до 
обработки каких-либо файлов из этого каталога). 

\11 \с .ћ1е асёіоп Аналогична \с дігесбогу асііоп, но вызывается для 
каждого файла, а не каталога. 

\11 \с „.дава Указатель на уоій, передаваемый пользовательским функциям. 

\гебигп 0=ОК, в противном случае количество каталогов, при обработке 
которых возникала ошибка, плюс количество ошибок, возвращенных 
пользовательскими функциями. 


Пример использования: 

\соде 
уоіа аігр (й1еѕігосё іп) { ргіпе# ("Каталог: <%5>\п", іп.пате); } 
уоіа В1ер (#1еѕіёгосё іп) { ргіпіё# ("Файл:%5\п", іп.пате); } 


// Вывести список всех файлов в текущем каталоге, исключая каталоги: 
ргосеѕѕ діг(.й1е асёіоп=#1ер); 


к , х Ш 5 

// Показать все, что находится в домашнем каталоге: 

ргосеѕѕ іг (.пате=" /һоте/6Ь", .ї1е асііоп=#1ер, 
.аігесёогу асііоп=аігр); 


\епасоде 

ЫГА 

#АеНпе ргосеѕѕ іг (...) ргосеѕѕ діг г ( (Н1езЕгис®) {__ МА АВС5__}) © 
116 ргосез$_91г_г(Н1езегисе 1еуе1); © 


© И снова они: три части функции, принимающей именованные аргументы. Но 
даже без этого приема эта структура необходима для обеспечения типобезопас- 
ности при передаче указателей на уо!4. 

Ө Макрос, который копирует позиционные инициализаторы, полученные от 
пользователя, в структуру составного литерала. 

© Функция, которая принимает структуру, подготовленную макросом ргосез$_ 
91г. Пользователи не должны вызывать ее напрямую. 


Возвращаясь к рис. 10.1, мы видим, что этот заголовок уже содержит частичное 
решение проблемы типобезопасности: определить тип 1еѕігисі и потребовать, что- 
бы функция обратного вызова принимала структуру такого типа. В конце структу- 
ры по-прежнему «закопан» указатель на уо. Мы могли бы вынести его наружу: 


СуредеЁ уоіа (*1еуеї Ёп) (5&гисЕ ШезегисЕ раһ, уоіа *іпдаќа); 
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Но поскольку мы определяем одноразовую структуру только для поддержки 
функции ргосеѕѕ іг, то можно и оставить указатель на уо!4 в ней. Далее, имея 
структуру, ассоциированную с функцией ргосеѕѕ іг, мы можем воспользоваться 
ей для написания макроса, который преобразует позиционные инициализаторы 
в параметры функции, как в разделе «Необязательные и именованные аргументы» 
выше. Структуры вообще упрощают жизнь. 

В примере 10.18 показано использование функции ргосез$_91х – части до и пос- 
ле облака на рис. 10.1. Функции обратного вызова просты: они всего лишь печа- 
тают отступы и имя каталога или файла. Тут даже нет никакого отступления от 
типобезопасности, потому что входным параметром обеих функций обратного вы- 
зова является структура вполне определенного типа. 

Ниже приведен пример вывода для каталога, содержащего два файла и подка- 
талог с/11еѕ, в котором находятся еще три файла: 


Дерево для ѕатр1е аіг: 
| сі1еѕ 


| а йе 
| апоёћег й1е 


Пример 10.18 < Программа вывода древовидной структуры текущего каталога 
(зпоми ігее.с) 


#1пс1и4е <ѕіаіо.һ> 
#іпс1џае "ргосеѕѕ діг.һ" 


уоіа ргіпё аіг (Н1езегисе іп) { 
Ғог (іп 1=0; 1< іп.дӢерһ-1; і++) ргіпё# (" "у; 
ргіпе# (" %=\п", іп.пате); 
Ғог (іп 1=0; 1< іп.дерёһћ-1; 1++) ргіпёЁ(" "); 
реп ("А \п") ; 

} 


уоіа рг1пЕ_Ше (Н1езегисе іп) { 
Ғог (116 1=0; 1< іп.аерёһ; 1++) ргапЕЁ(" "у 
ргіпїЕ ("| %$3\п", іп.пате); 


} 


іпё таіп (іп агдс, сһаг **агду) { 
сһаг *ѕёагі = (агдс>1) ? агду[1] : "."; 
ргіпі# ("Дерево для%ѕ:\п", ѕбагі ? загі : "текущего каталога"); 
ргосеѕѕ діг (.пате=ѕіагё, .ћ1е асёіоп=ргіпё й1е, 
.аігесіогү асііоп=ргіпе діг); 


Как видите, па1п передает функции ргіпї діги ргіпё е в ргосеѕѕ іг в надежде, 
что ргосеѕѕ іг вызовет их в нужное время с нужными аргументами. 
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Сама функция ргосезз_41г приведена в примере 10.19. Основная часть ее работы 
посвящена созданию структуры, описывающей файл или каталог, обрабатывае- 
мый в данный момент. Переданный ей каталог открывается с помощью функции 
орепӣіг. Затем каждое обращение к геаййіг возвращает очередной элемент катало- 
га – файл, подкаталог, ссылку и т. п. В структуру ї1еѕігисё записывается инфор- 
мация о текущем элементе. Эта структура передается той иной функции обратно- 
го вызова в зависимости от того, что мы сейчас обрабатываем: файл или каталог. 
Если это каталог, то далее эта же функция вызывается для него рекурсивно. 


Пример 10.19 4 Рекурсивно обходим каталог и применяем функцию Ее асііоп 
к каждому обнаруженному в нем файлу и функцию йігесіогу асііоп – к каждому 
обнаруженному каталогу (ргосеѕѕ_аіг.с) 


#іпс1џӣе "ргосеѕѕ аіг.һ" 
#іпс1џде <дігепё.һ> //зегисЕ дігепё 
#іпс1џае <5а1ір.һ> //#гее 


іпё ргосеѕѕ діг г(й1еѕігисё 1е\е1) { 
1Е (!1еуе1.Ё011пате) { 
1Е (1еуе1.пате) 1еуе1. #01 1пате=1еуе1.пате; 
е1іѕе Іеуе1. #011 пате="."; 


} 


іп еггсё=0; 


РІК *сиггепё=орепаіг (Іеуе1. #11папе) ; © 
1Е (!сиггепе) гебигп 1; 
ЗЕгисЕ аігепё *епёгу; 


мһі1е ( (епёгу=геаааіг (сиггеп*))) { 
1Е (епёгу->а пате [0]=='.') сопЕ1пие; 
б1еѕігосі пехї Іеме] = Іеме1; 9 


пех Іеуе1.пате = епёгу->а пате; 
азрг1 пе Е (&пехё Іеме1.Ёџ11пате, "%5/%5", Іеуе1. Ғџ11пате, 
епігу->а пате); 


1Ё (епёгу->а ёуре==рт рік) { 
пех 1Іеуе1.аерёһ ++; 
1Е (1еуе1.дӢігесёогу ас®1оп) 1еуе1.дігесіогу асііоп (пех Іеме1); Ө 
еггсі+= ргосеѕѕ іг г (пех 1Іехе1); 
} 
е1зе 1Е (епігу->а ёуре==ртТ КЕС && 1Іеуе1.й1е асііоп) { 
1еуе1 .Н1е_асЕ1оп (пехе Іече1); ө 
еггсі+= пех Іеуе1.еггог; 
} 
Егее (пех 1еуе1.Ёџ11папте); 5, 
} 
с1озеа1х (соггепі); 
геіогп еггсі; 


} 


© Функции орепа1х, геайііг и с1оѕейіг определены в стандарте РОЅІХ. 
Ө Для каждого элемента каталога создаем копию входной структуры Шезгис® и 
записываем в нее информацию о текущем элементе. 


244 * Часть |. Язык 


© Вызываем функцию обработки каталога, передавая ей новую структуру. Рекур- 
сивно обрабатываем подкаталог. 

Ө Вызываем функцию обработки файла, передавая ей новую структуру. 

Ө Структуры ї1еѕёгисі, создаваемые на каждом шаге, — не указатели на память, 
выделенную с помощью па! 10с, поэтому никакой код для управления памятью 
не нужен. Однако аѕргіпё# неявно выделяет память для поля Ёџ!1 пате, и эту па- 
мять затем нужно освободить во избежание утечки. 

Описанная стратегия позволила успешно реализовать необходимую инкапсу- 
ляцию: функции печати ничего не знают о средствах РОЅІХ для обработки ка- 
талогов, а рғосеѕѕ_іпс не в курсе того, что делают функции. И благодаря специа- 
лизированной для функции структуре данных удалось сделать поток управления 
естественным. 


Обобщенные структуры 


Связанные списки, хэши, деревья и аналогичные структуры данных применяются 
в самых разных ситуациях, поэтому разумно сделать так, чтобы они манипули- 
ровали указателями на уо14, а пользователь проверял типы на входе и на выходе. 

В этом разделе мы рассмотрим стандартный пример из учебника: хэш для под- 
счета частот вхождения символов. Хэш - это контейнер, в котором хранятся пары 
ключ/значение, его задача — обеспечить быстрый поиск значения по ключу. 

Прежде чем приступать к обработке файлов в каталоге, необходимо настроить 
обобщенный хэш, имеющийся в СІЛЬ, под нужды программы; ключом у нас будет 
символ (Опісоде, а значением – целое число. Сконфигурировав этот компонент 
(что само по себе дает неплохой пример работы с обратными вызовами), уже легко 
будет реализовать функции обратного вызова для обхода файловой системы. 

Как мы увидим, функции едџа1 свагз и ргіпёопе будут использоваться в роли 
обратных вызовов из хэша, то есть хэш будет вызывать их, передавая указатели на 
уо14. Поэтому в первых строчках этих функций объявляются переменные нужно- 
го типа и производится приведение указателя на уоій к указателю на конкретный 
тип. 

В примере 10.20 показан заголовок, показывающий, что из кода в примере 10.21 
предназначено для пользователей. 


Пример 10.20 + Заголовок для ипісіг.с (ипісїг.ћ) 
#іпс1џае <911іБ.һ> 


уоіа Һаѕћһ а сһагасіег (дип1спаг ис, СбНаѕћТар1іе *ВазН); 
уоіа ргіпёопе (уоіа *Кеу_1п, уоіа *уа1 іп, уоіа *хх); 
СНаѕћТар1е *пем опісоде соџпёіпд һћаѕћ(); 


Пример 10.21 * Функции для работы с хэшем, в котором ключом является символ 
Опісоае, а значением - целочисленный счетчик (ипісїг.с) 

#1пс104е "ѕёгіпд обі1ібіеѕ.һ" 

#1пс1а4е "ргосеѕѕ аіг.һ" 

#іпс1оаӢе "опісёг.һ" 
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#іпс10ае <91ір.һ> 
#іпс10џае <ѕёа1ір.һ> //са11ос, та11ос 


суредеЕ зЕгисЕ { © 
іп соипЕ; 
} сопе 5; 


уоіа ћһаѕһ а сһагасѓег (дип1спаг ис, СНаѕћТаріе *һаѕһ) { 
соцпё 5 *сі = 9 Һаѕһ ёар1е 1оокир (Һаѕһ, &ис); 
іЁ (1с) { 
СЕ = са11ос (1, зілеоѓ (соџпё в)); 
допісһаг *пемсһаг = та11ос ($12е0# (дџпісћһаг)); 
*пемсһаг = ис; 
9 _һаѕһ бар1е іпѕегё (Һаѕһ, пемсһаг, сё); 
} 
сЕ->со0пЕ++; 


} 


уоіа ргіпёопе (уоіа *Кеу іл, \014 *уа1_1п, уоіа *ідпогеа) { 2, 
допісһаг сопзЕ *Кеу= Кеу іп; © 
соцпё_ѕ сопзЕ *уа1= ма1 іп; 
сһаг иЁ#8 [7]; 
оСЕ8 [9 џпісһаг бо и Е8 (* кеу, иб#8) ]='\0'; 9 


ре1пЕЁ ("%5\6%1\п", 08, уа1->соипЕ); 
} 


ѕбасіс дроо1еап едџа1 сһагѕ (уоіа сопѕё * а іп, уоіа сопѕё * Ь іп) { © 
сопзЕ дип1спаг *а= а іп; © 
соп5Е дип1спаг *р= Ь іп; 
геёогп (*а==*Ъ); 


СНаѕћТар1е *пем џпісоде соцпёіпд һаѕћ () { 
геёцгп 9 һҺаѕћһ бар1е пем (9 ѕг Һаѕһ, едоа1 сһагѕ); 


} 


© Да это действительно структура, содержащая всего одно целое. В один прекрас- 
ный день она, возможно, спасет вам жизнь. 

Ө Эта функция будет обратно вызываться из 9 һаѕћ ёар]е Ғогеасћ, поэтому она 
принимает указатели на уо!4 для ключа и значения и еще один указатель, кото- 
рый в функции не используется. 

Ө Если функция принимает указатель на уо14, то в самом начале необходимо за- 
вести переменную правильного типа, к которому приводится этот указатель. 
Не откладывайте это на потом – сделайте сразу же, когда можно проверить, что 
приведение типа прошло успешно. 

© Шести символов (сһаг) достаточно для представления любого символа Оп1со4е 
в кодировке ОТЕ-8. Еще один байт добавлен для завершающего нуля, так что 
7 байт нам всегда хватит. 

Ө Поскольку в хэше могут храниться ключи и значения любого типа, СТАЛЬ про- 
сит предоставить функцию сравнения двух ключей на равенства. Впоследствии 
функция пем џлісоде соип1п9_пазй передаст ее функции создания хэша. 
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© Я уже говорил, что в первой строке функции, принимающей указатель на уоій, 
необходимо присвоить этот указатель переменной нужного типа. После этого 
вы снова оказываетесь в типобезопасной зоне. 


Итак, мы имеем функции для поддержки хэша, содержащего символы Отисо4е. 
А впримере 10.22 показано, как они используются, и демонстрируется примене- 
ние рассмотренной выше функции ргосеѕѕ іг для подсчета всех символов в фай- 
лах каталога, представленных в кодировке ОТЕ-8. 

Поскольку используется та же функция ргосез5_41г, что и раньше, обобщенная 
процедура не должна вызывать вопросов. Функция обратного вызова для обра- 
ботки одного файла Ваз} а #1е принимает параметр типа ї]еѕігисї, но внутри этой 
структуры скрыт указатель на уо!4. Наши функции используют этот указатель как 
указатель на структуру хэша из СЪ. Поэтому первым делом ћаѕћ а #]е приводит 
указатель на уо!4 к типу указателя на эту структуру, восстанавливая тем самым 
типобезопасность. 

Каждый компонент можно отлаживать изолированно, нужно лишь знать, что и 
когда подается на вход. Но можно проследить за передачей хэша из одного ком- 
понента в другой и убедиться, что он действительно передается ргосеѕѕ йіг в поле 
„даа входной структуры #1еѕігисї, что затем ћаѕћ а #1е приводит .Чаёа обратно 
к типу СНаѕћТар]1е и что далее он передается функции ћаѕћ а_спагаскег, которая 
увеличивает связанный с символом счетчик или добавляет новый символ в хэш. 
Послеэтогод ћаѕћ ёар1е Ғогеасһ с помощью обратного вызова ргіпёопе распечаты- 
вает все элементы хэша. 


Пример 10.22 * Счетчик символов; используется так: сһагсї уоиг_аїг | зой -К 2 -п 
(сһагсї.с) 


#дейпе СМО Ѕ00КСЕ // чтобы ѕЕдіо.һ определял аѕргіпёѓ 
#іпс1џае "ѕёгіпд ибі1іёіеѕ.һ" //5Егіпд Ёгот йе 

#іпс10ае "ргосеѕѕ аіг.һ" 

#іпс1џаӢе "ипісёг.ћ" 

#іпс1џае <9116Ы.һ> 

#іпс10оде <з&9115.1> //Егее 


уоіа ћһаѕһ а #1е (Н1езЕгисЕ раёћ) { 
СНаѕћТар1е *һаѕһ = раєһ.ааќа; © 
сһаг *5# = зЕг1п9_Ёгом_#Не (раһ. #џ11пате); 
1Е (15#) гебџгп; 
сһаг *5# сору = $ЕЁ; 
1ЁЕ (9 ОЁЁ8 уа1ідабе (5#, -1, МОБ) { 
Ғог (9оџпісһаг ис; (ос = 49 џЁ#8 де сһаг (5#)) !='\0'; 2, 
ЗЕ = 9 0ЕЁВ8 пех сһаг(5#)) 
Һаѕһ а _сһагасіег (ис, һаѕһ); 
} 
Ғгее (5Ё_сору); 
} 


іпё таіп (іп агдс, сһаг **агду) { 
СНаѕћТар1е *һаѕһ; 
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Һаѕһ = пем_ип1со4е_соипЕ1п9_паз|(); 
сһаг *збагЕ=МОЬЬ; 
1Е (агдс>1) аѕргіпё# (&5№агё, "%5", агду[1]); 
ргіпё# ("Хешируется%$\п", ѕбагі ? ѕёагі : "текущий каталог"); 
ргосеѕѕ діг(.пате=ѕбагё, .й1е асёіоп=ћаѕһ а й1е, .аёа=һаѕһ); 
9 Һаѕһ бар1е Ғогеасһ (һаѕһ, ргіпбопе, МОГ); 

} 


© Напомним, что в структуре #1еѕігосі есть поле да*а, содержащее указатель на 
уо!4. Поэтому в первой строке этой функции, естественно, объявляется пере- 
менная нужного типа, которой присваивается переданный указатель на уоій. 

Ө В кодировке ОТЕ-8 длина символа переменна, поэтому нужна специальная 
функция для получения текущего символа или перехода к следующему симво- 
лу в строке. 


Я отношу себя к недотёпам, способным сделать ошибку в любом месте, где это 
возможно, и все же я редко помещал структуру неподходящего типа в список, де- 
рево и т. п. (вообще не припоминаю такого случая!). Вот какие правила обеспече- 
ния типобезопасности я для себя выработал. 

О Если есть два списка, в которых хранятся указатели уо!: асііхе дгоџрѕ и 
регзопз – томнесовершенно очевидно, чтовстрокевида д 111 аррепа (ас&1уе_ 
дгоирз, пех регѕоп) делается попытка поместить структуру не в тот список, 
и никакая помощь от компилятора мне в этом случае не нужна. Поэтому 
первый секрет успеха – придумывать такие имена, при которых нелепость 
действия видна с первого взгляда. 

Размещать обе части, показанные на рис. 10.1, как можно ближе друг к дру- 

гу, так чтобы, изменив одну, вы легко могли изменить и другую. 

Я уже не раз говорил, что в начале любой функции, принимающей указа- 

тель на уо!4, нужно скопировать этот указатель в переменную конкретного 

типа, выполнив тем самым приведение типов, как это сделано в ргілёоле и 

едџа1 сһагз. Делая это прямо «на границе», вы повышаете шансы своевре- 

менно выполнить приведение, а после того как это сделано, проблему типо- 
безопасности можно считать решенной. 

О Ассоциирование специально созданной структуры с конкретным примене- 
нием обобщенной процедуры или структуры - весьма разумная мысль. 

— Если такой специальной структуры нет, то при любом изменении типа 
входного аргумента придется найти все случаи приведения указателя 
на уо! к указателю на старый тип и заменить в них старый тип новым. 
Компилятор здесь ничём не поможет. Если же вы передаете данные в спе- 
циальной структуре, то нужно будет всего лишь изменить определение 
этой структуры. 

— Продолжая эту мысль: если вы обнаружили, что функции обратного вы- 
зова нужно передать дополнительную информацию - а весьма вероятно, 
что так оно будет, – то надо будет только добавить еще одно поле в опре- 
деление структуры. ‘ 
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— Может показаться, что передача одного числа не заслуживает заведения 
специальной структуры, но это очень опасное заблуждение. Допустим, 
имеется обобщенная процедура, которая принимает функцию обратного 
вызова и указатель на уо!4, который следует этой функции передать. Вы- 
глядит это так: 


уоіа са1]БасКк (уоіа *уо1А1п) { 
ЧочЬ1е *іпроё = уоіаіп; 


} 


іп 1=23; 

депегіс ргосейџге (са11раск, &1); 

Вы заметили, что в этом невинном, на первый взгляд, коде тантся беда? 
Какой бы комбинацией бит ни было представлено число 23 типа 11%, мо- 
жете не сомневаться, что после чтения его как доц 1е в функции са! баск 
ничего похожего на 23 вы не получите. Объявление новой структуры, 
может, и напоминает бюрократию, то помогает предотвратить эту естест- 
венную ошибку: 

Суредеё зёгисе { 


іп 1еуе1; 
} опе_1опе1у_1п%едег; 


— Мне кажется, что с точки зрения восприятия программы удобно знать, 
что существует единственный тип, используемый для всех схожих задач 
в данном участке кода. Выполняя приведение к типу, специально опре- 
деленному для конкретной ситуации, я знаю, что поступаю правильно; 
нет места тревожным сомнениям, к какому типу приводить: сћаг *, сһаг ** 
или, может быть, к мсћаг ё *. 

В этой главе мы рассмотрели много случаев, когда передача структуры в фуик- 
цию и возврат структуры из функции улучшают программу. С помощью хоро- 
шего макроса входную структуру можно заполнить значениями по умолчанию 
и реализовать механизм именованных параметров. Выходную структуру можно 
построить на лету с помощью составного литерала. Для копирования структуры 
(как в случае рекурсии) достаточно простого знака равенства. Возврат пустой 
структуры – тривиальный случай применения позиционного инициализато- 
ра, в котором не задано ни одно поле. А ассоциирование специально созданной 
структуры с функцией решает многие проблемы использования обобщенных про- 
цедур и контейнеров, поэтому применение обобщенного компонента — подходя- 
щий случай воспользоваться на практике всего приемами работы со структурами. 
Структуры - это еще и удобное место для размещения кода ошибки, который ие 
придется втискивать в аргументы функции. Так что небольшая трата времени на 
написание определения типа окупается с лихвой. 


Глава П] 


« оосаооөоовзооссвооооооооосооооооовооооооооооооообоов 


Объектно- 
ориентированное 
программирование на С 


Мы ценим простое выражение сложных идей. 


Мы за плоские формы, 
Потому что они разрушают иллюзии и пока- 
зывают голую правду. 


— Ге Тирге «51іеѕһом ас Егее Опіуегѕісу» 


Вот как устроена типичная библиотека на С или любом другом языке: 

О небольшой набор структур данных, представляющих ключевые понятия 

предметной области, к которой относится библиотека; 

О набор функций (их часто называют интерфейсными) для манипуляции эти- 

ми структурами данных. 

Например, в библиотеке для работы с ХМІ. будут структуры для описания 
ХМГ-документа и, возможно, его представлений, а также многочисленные функ- 
ции для перехода между структурой данных в памяти и ХМГ-файлом на диске, 
для поиска элементов в структуре ит. д. В библиотеке для работы с базами данных 
будут структуры для представления состояния взаимодействия с базой и, возмож- 
но, для представления таблиц, а также функции для отправки запросов к базе и 
разбора полученных от нее данных. 

Это вполне разумный способ организации программы или библиотеки. Он по- 
зволяет автору выражать концепции с помощью глаголов и существительных, ха- 
рактерных для решаемой задачи. 

Я не буду тратить времени (и разжигать страсти) на формулирование точного 
определения объектно-ориентированного программирования (ООП), но из при- 
веденного выше описания объектно-ориентированной библиотеки должно быть 
ясно, какую цель мы преследуем: несколько центральных структур данных, с каж- 
дой из которых связан набор функций для выполнения операций над этой струк- 
турой. 

Для любого эксперта, считающего, что некоторая возможность — неотъемлемая 
характеристика ООП, найдется другой эксперт, который полагает, что она толь- 
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ко отвлекает от существа ООП!. Тем не менее перечислю несколько дополнений 
к основной идее о структуре и функциях, которые распространены очень широко. 
О Наследование, позволяющее расширить структуру, добавив к ней новые 
элементы. Ы 
О Виртуальные функции, которые определяют поведение любого объекта 
класса, но могут быть переопределены для других экземпляров даниого 
класса или его потомков в дереве наследования. 

О Точное управление областью видимости, в частности разделение элементов 

структуры на открытые и закрытые. 

О Перегрузка операторов – синтаксический прием, позволяющий изменять 

семантику операции в зависимости от типов операндов. 

О Механизм подсчета ссылок, позволяющий освобождать объект тогда и толь- 

ко тогда, когда ни один из связанных с ним ресурсов более не используется. 

В этом разделе мы рассмотрим, как эти идеи можно реализовать на С. Ни одна 
из них не представляет особых трудностей: для подсчета ссылок нужно хранить 
счетчик, для перегрузки функций (но не операторов) используется ключевое сло- 
во бепегіс, специально предназначенное для этой цели, а виртуальные функции 
можно реализовать с помощью функции диспетчеризации, возможно, дополнен- 
ной индексированной таблицей альтернативных функций. 

И это подводит нас к интересному вопросу: если все эти расширения базовой 
идеи о структуре и связанных с ней функциях так просто реализовать и для этого 
требуется всего несколько строк кода, то почему пишущие на С так редко ими 
пользуются? 

Гипотеза Сепира-Уорфа о связи языка с мышлением и способом познания 
реальности, формулировалась по-разному; мне нравится формулировка, соглас- 
но которой одни языки заставляют нас размышлять о таких предметах, которые 
в других языках даже не рассматриваются. Многие языки вынуждают принимать 
во внимание пол, потому что на них очень трудно построить высказывание о че- 
ловеке, не употребляя признаков пола: он, она, его или ее. С заставляет думать 
о выделении памяти больше, чем другие языки (и это порождает у тех, кто на С 
не пишет, ложные стереотипы, будто весь код на С – не что иное, как манипули- 
рование памятью). В языках, где имеются развитые средства областей видимости, 
приходится внимательно следить за тем, когда и каким объектам видна перемен- 
ная, – даже если технически язык позволяет откомпилировать программу, в кото- 
рой все члены объекта объявлены открытыми, кто-нибудь наверняка обзовет вас 
лентяем и напомнит о нормах языка, требующих выбирать как можно более узкую 
область видимости. 

Поэтому программирование на С ставит нас в привилегированное положение, 
чего не случилось бы, если бы мы писали на каком-нибудь официальном объект- 


' Однажды я присутствовал на собрании группы пользователей Јауа, где с основным до- 


кладом выступал Джеймс Гослинг (автор Јауа). Когда начали задавать вопросы, кто-то 
спросил: «Если бы вы могли создать Јауа еще раз, что бы вы изменили?» Гослинг отвстил: 
«Я бы выкинул классы». Аеп НоіиЬ «Му ежеп4$ іѕ еуії». 
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но-ориентированном языке типа С++ или Јауа: мы можем реализовать целый ряд 
расширений базового объекта, состоящего из структуры и функций, пользуясь 
простыми средствами, но не обязаны это делать и можем отказаться от этого ре- 
шения, если оно только усложняет программу, не принося ощутимой выгоды. 


Расширение структур и словарей 


В начале этого раздела я приведу пример типичной схемы организации библио- 
теки: структура плюс набор функций для операций с ней. Но, как следует из на- 
звания, раздел все же посвящен расширениям: как добавлять новые элементы 
в структуру и как добавлять новые функции, которые будут правильно работать 
с уже существующими и с новыми структурами? 

В 1936 году, исследуя формальную математическую задачу (проблему разре- 
шения), Алонсо Чёрч разработал лямбда-исчисление – формальный аппарат опи- 
сания функций и переменных. В 1937 году, работая над той же задачей, Алан Тью- 
ринг описал формальный язык в виде машины, оснащенной лентой и головкой, 
которая могла двигаться вдоль ленты для чтения и записи данных. Впоследствии 
была доказана эквивалентность лямбда-исчисления Чёрча и машины Тьюринга — 
любое вычисление, которое можно выразить с помощью одного из этих средств, 
можно выразить и с помощью другого. С тех пор конструкции, придуманные Чёр- 
чем и Тьюрингом, лежат в основе различных способов структурирования данных. 

Лямбда-исчисление опирается на списки именованных элементов; в псевдоко- 
де, написанном на его основе, сведения о человеке можно было бы представить 
так: 

(регѕоп ( 

(пате "51пеаа") 

(аде 28) 

(Һеідһе 173) 

)) 


В случае машины Тьюринга мы резервируем для структуры место на ленте. 
В первых нескольких позициях будет записано имя, затем – возраст и т. д. Спустя 
почти сто лет лента машины Тьюринга по-прежнему остается неплохим описани- 
ем памяти компьютера: вспомните раздел «Все, что нужно знать об арифметике 
указателей» выше, где говорилось, что база плюс смещение - это и есть основа 
построения структур на С. Когда мы пишем: 
СуредеЁ зегисЕ { 

сһаг * пате; 


аоџЬ1е аде, һеідһ; 
} регзоп; 


регзоп $1пеа = {.пате="Ѕіпеаа", .аде=28, .һеідһё=173}; 


з1пеа4 указывает на начало блока памяти, а ѕіпеай.ћеідћё – на позицию ленты, 
следующую сразу после папе и аде (с учетом дополнительных позиций для вырав- 
нивания). 
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Остановлюсь на некоторых различиях между представлением в виде списка и 
в виде блока памяти. 

О Смещение на определенное расстояние от некоторого адреса и по сей день 
остается одной из самых быстрых операцйй компьютера. Компилятор С 
даже транслирует имена полей в смещения. Напротив, поиск чего-то в спис- 
ке требует просмотра: если дано имя поля "аде", то какой элемент списка 
ему соответствует и где он находится в памяти? В каждой системе есть свои 
способы сделать такой поиск максимально быстрым, но все равно он неиз- 
бежно занимает больше времени, чем простое смещение от базы. 

Добавить новый элемент в список гораздо проще, чем новое поле в структу- 
ру, состав которой фиксирован на этапе компиляции. 

Компилятор С может сообщить, что ћіедћі — опечатка; для этого ему нужно 
лишь заглянуть в определение структуры и убедиться, что такого элемента 
в нем нет. Но список допускает расширение, поэтому мы не можем узнать, 
есть в нем элемент ћіедћі или нет, пока не запустим программу и не проверим. 

Последние два пункта демонстрируют некое противоречие: с одной стороны, 
нам нужна расширяемость, которая позволила бы добавлять поля в структуру, 
а с другой – регистрация, позволяющая сообщать об ошибке, когда производится 
обращение к полю, отсутствующему в структуре. Приходится искать компромисс, 
и существуют различные подходы к контролируемому расширению существую- 
щего списка. 

В С++, Јауа и производных от них языках имеется синтаксис для порождения 
нового типа, расширяющего существующий. При этом сохраняются скорость, 
обусловленная простым смещением от базы, и проверка на этапе компиляции, 
но ценой повышенного многословия: если в С имеется лишь ѕёгисі с простейши- 
ми правилами видимости (см. раздел «Область видимости» ниже), то в Јауа мы 
видим ключевые слова ітріетепіѕ, ех{епдз, йпа1, іпѕіапсеої, с1аз$, 115, іпіегѓасе, 
ргічаќе, руб] 1с, ргоёесёей. 

Рег, Ру{Поп и многие языки, берущие начало от 18Р, основаны на списках име- 
нованных элементов, и именно так реализуют структуру. Для расширения спи- 
ска достаточно добавить в него новые элементы. Плюсы: полная расширяемость 
за счет добавления именованного элемента. Минусы: отсутствие регистрации и, 
несмотря на различные ухищрения, значительное снижение скорости, по сравне- 
нию со сложением смещения и базы. Во многих языках из этого семейства есть 
система определения классов, позволяющая зарегистрировать некий набор эле- 
ментов списка и затем проверять, соответствует ли использование определению. 
При правильном применении это обеспечивает приемлемый компромисс мсжду 
простотой расширения и проверкой корректности. Но вернемся к старому добро- 
му С; его структуры дают самый быстрый способ доступа к полям, и мы получаем 
проверку на этапе компиляции ценой утраты расширяемости на этапе выполне- 
ния. Если требуется гибкий список, который может расти во время выполнения, 
то необходима какая-то структура данных вроде хэшей СІ1Ь или описываемого 
ниже простого словаря. 
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Реализация словаря 


Построить словарь с теми средствами, которые имеются в основанном на струк- 
турах языке С нетрудно. И это даст нам хорошую возможность создать объект и 
продемонстрировать, как на практике работает концепция «структура плюс функ- 
ции», которой и посвящена эта глава. Отметим, однако, что другие авторы уже 
претворили рассмотренную идею словаря в жизнь и тщательно протестировали 
ее; см., например, индексированные таблицы данных С НаѕћТаЫе в библиотеке 
СТА. Мы лишь хотим показать, что наличия составных структур и простых мас- 
сивов достаточно для реализации объекта «словарь». 

Мы начнем с простой пары ключ/значение. Необходимые для работы с ней 
функции находятся в файле ќеуоа/.с. В примере 11.1 приведен заголовок с объ- 
явлениями всех интерфейсных функций. 


Пример 11.1 < Заголовок – открытый интерфейс класса ключей и значений (Кеума!.П) 


суредеЁ зЕгисЕ Кеууа1 { 
сһаг *Кеу; 
уоіа *уаіџе; 

} Кеууа1; 


Кеууа1 *Кеууа1 пем (сһаг *Кеу, уоіа *уа1ие); 

Кеууа1 *Кеууа1 сору (Кеууа1 сопѕі *іп); 

уоіа Кеууа1 Ёгее (Кеууа1 *іп); 

116 Кеууа1 таёсһеѕ (Кеууа1 сопзе *іп, сһаг сопѕб *Кеу); 


Читатели с опытом работы на традиционных объектно-ориентированных язы- 
ках программирования увидят здесь много знакомых черт. При разработке нового 
объекта первое побуждение – написать функции создания, копирования и осво- 
бождения, что в этом примере и сделано. Затем обычно идут функции, реализую- 
щие специфику работы со структурой, в данном случае функция Кеууа1 таїсћеѕ, 
которая проверяет, совпадает ли ключ в паре Кеууа]1 с переданной строкой. 

Наличие функций пем/сору/тее означает, что вам не придется мучиться 
с управлением памятью: в функциях пем и сору память выделяется с помощью 
па110с, а в функции Нее — освобождается с помощью Ёгее. Отныне код, в котором 
используется объект, никогда не будет вызывать для него па]10с и Ёгее явно, до- 
веряя управление памятью функциям Кеууа] пен, Кеууа1 соруи Кеууа] Ёгее. 


Пример 11.2 + Типичный шаблон кода объекта: структура плюс функции 
создания, копирования и освобождения (Кеума!.с) 


#1пс1и4е <39116.1> //та11ос 
#1пс1и4е <ѕігіпдѕ.һ> //ѕігсаѕестр (описана в РОЅІХ) 
#іпсіџае "Кеууа1.һ" 


Кеууа1 *Кеууа1 пем (сһаг *Кеу, уоіа *уаше) { 
Кеууа1 *о0џі = та11ос ($12е0# (Кеууа1)); 
оці = (Кеууа1) {.Кеу = Кеу, .уа1џе=уаіџе}; © 
геіигп оце; 
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/** Копировать пару ключ/значение. В новой паре хранятся указатели на 
данные из старой пары, а не копии данных. */ 
Кеууа1 *Кеууа1 сору (Кеума1 сопѕі *іп) { 
Кеууа1 *о0џі = та11ос ($12еоЕ (Кеууа1)); 
*оиЕ = *іп; (2, 
геіогп ооб; 


} 
уоіа Кеууа]1 Ёгее (Кеума1 *іп) { Ёгее (іп); } 


іпё Кеума1 таёсһеѕ (Кеууа] сопѕі *іп, сһаг сопѕё *Кеу) { 
геіцгп !ѕігсаѕестр (іп->кеу, Кеу); 


} 


© Позиционные инициализаторы облегчают заполнение структуры. 

Ө Напомним, что для копирования содержимого структуры достаточно знака 
равенства. Если бы мы хотели скопировать также данные, на которые ведут 
указатели, хранящиеся в структуре (а не просто сами указатели), то после этой 
строки пришлось бы написать дополнительный код. 


Теперь у нас есть объект, представляющий одну пару ключ/значение, и мы мо- 
жем перейти к организации словаря как списка таких пар. В примере 11.3 при- 
веден заголовок. 


Пример 11.3 % Открытый интерфейс словаря (аісї.ћ) 


#1пс1и4ае "Кеууа1.в" 
ехїегп уоій *аісііопагу пої ЁҒоџпа; ® ў 


ёуредеЁ ѕігоисі 41сЕ1опагу{ 
Кеууа1 **раігѕ; 
116 Іепдёһ; 

} аісёіопагу; 


41сЕ1опагу *дісііопагу пем (уоіа); 

91сЕ1опагу *дӢісёіопагу сору (дісёіопагу *іп); 

уоіа аісііопагу Ёгее (дісёіопагу *іп); 

уоіа аісііопагу ааа (аісёіопагу *іп, сһаг *Кеу, уоіа *уа1іџе); 
уоіа *аӢісёіопагу Нпа (дісііопагу соп *іп, сћһаг сопзі *Кеу); 


© Это признак, возвращаемый, когда ключ не найден в словаре. Он должен быть 
открытым. 


Как видите, здесь присутствуют все те же функции пем/сору/ќгее, а также 
функции, реализующие специфику словаря. И еще некий признак, о котором мы 
поговорим ниже. В примере 11.4 показана закрытая реализация. 


Пример 11.4 < Реализация словаря (Яісі.с) 


#1пс1и4е <ѕЕаіо.һ> 
#1пс1и4е <ѕёа1ір.һ> 
#іпс1іџае "ісе. һ" 
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уоіа *41сЕ1опагу пої Ёоџпа; 


41сЕ1опагу *дісііопагу пем (уоіа) { 
ѕбабіс іпе апғ; © 
1Ё (!аісёіопагу пої Ғоџпа) дісііопагу поё _Ромпа = &апЕЁ; 
аісёіопагу *о0џё= та11ос ($12е0Е (аісёіопагу)); 
*оцё= (аісёіопагу) { }; 
геёогп оц; 


} 


ѕбаііс уоіа дісёіопагу айа Кеууа1 (941сЕ1опагу *іп, Кеууа1 *Ку) { (2, 
іп->1епдёһ++; 
1п->ра1г$ = геа11ос (іп->раігѕ, ѕігеої (Кеу\уа1*) *іп->1епдіёћ); 
іп->раігѕ [іп->1епдёһ-1] = Ку; 


} 


уоіа аісёіопагу ааа (дісііопагу *іп, сһаг *Кеу, уоіа *ча1џе) { 
1Е (!Кеу) (Ёргіпеё (зЕ4егг, "Ключ не может быть равен М№МОІ1.\п"); аБоге();} Ө 
дісёіопагу айа Кеууа1 (іп, кеууа1 пем (кеу, уа1іџе)); 


} 


уоіа *дӢісііопагу бла (941сЕ1опагу сопзЕ *іп, сһаг сопѕі *Кеу) { 
Рог (іп 1=0; 1< іп->1епдёһ; 1++) 
1Е (Кеууа1 таёсћһеѕ (1п->ра1г$[1], Кеу)) 
геёџгп іп->раігѕ [1] ->уа1е; 
геёцгп дісёіопагу поё Ёоџпа; 


} 


91сЕ1опагу *41сЕ1опагу сору(дісёіопагу *1п) { 
91сЕ1опагу *оџі = 91сЕ1опагу_пем(); 
Ғог (108 1=0; 1< іп->1епдёһ; 1++) 
дісёіопагу ааа Кеууа1 (ооё, Кеууа1_сору (іп->раігѕ[і])); 
геёогп ооб; 


} 


уоіа аісііопагу Їгее (дісііопагу *іп) { 
Рог (116 1=0; 1< іп->1епдёһ; 1++) 
Кеууа1 Ёгее (1п->ра1г5[1]); 
Егее (іп); 


} 


© Вполне может оказаться, что значением ключа является МИЦ, поэтому необхо- 
дим уникальный признак, обозначающий отсутствие ключа. Я не знаю, где в па- 
мяти хранится переменная 91, но ее адрес заведомо уникален. 

Ө Напомню, что функция, помеченная ключевым словом зѓаїіс, не видна вне 
файла, так что это еще одно напоминание о том, что она является закрытой 
частью реализации. 

© Признание в грехе: использование аБог{ — дурной стиль; лучше было бы напи- 
сать какой-нибудь макрос типа того, что приведен в файле з(ор1Ё.1. Я поступил 
так, чтобы продемонстрировать одну особенность тестовой оснастки. 


Теперь у нас есть словарь, и в примере 11.5 показано, как пользоваться им, не за- 
ботясь об управлении памятью, возложенном на функции пе\//сору/тее/а4Ч4, и не 
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работая явно с парами ключ/значение, поскольку они находятся на уровне ниже 
того, который нас интересует. 


Пример 11.5 * Пример использования словарного объекта; копаться в потрохах 
структуры нет нужды, так как интерфейсные функции предоставляют все 
необходимое (41с{ изе.с) 


#1пс1и4е <зЕ41о.в> 
#10с10ае "Яісё.һ" 


іп ма1п() { 
116 2его = 0; 
Поа опе = 1.0; 
сһаг &мо[] = "емо"; 
91сЕ1опагу *а = ӣісііопагу пем (); 
дісёіопагу ааа (а, "ап іп", &2его); 
дісёіопагу ааа (а, "а Поа", бопе); 
дісёіопагу ааа (а, "а ѕёгіпд", &6мо); 
ргіпеЁ ("Я сохранил целое: %і\п", 
* (1пе*) аісёіопагу йпа (а, "ап 1пё")); 
ргіпіё ("Сохраненная строка: %з\п", (сһаг*) дісќіопагу йпа(а, "а зігіпд")); 
41сЕ1опагу_Ёгее (а); 


Таким образом, написания структуры с функциями пем /сору /Ётее и прочими 
оказалось достаточно для обеспечения нужного уровня инкапсуляции: словарю 
безразлично внутреннее устройство пары ключ/значение, а приложение может не 
думать об устройстве словаря. 

Стереотипный код не так плох, как в некоторых других языках, но, конечно, 
имеется некое повторение при реализации функций пем/сору/тее. По мере раз- 
вития примера мы еще не раз столкнемся с этим шаблоном. 

Когда мне наскучило повторять один и тот же код, я даже написал несколько 
макросов для его автоматической генерации. Например, функции копирования 
различаются только способом работы с внутренними указателями, поэтому мож- 
но написать макрос, который автоматизирует создание всего стереотипного кода, 
не относящегося к внутренним указателям: 

#Аейпе де# орјесі сору (ёпате, ...) 
уоіа * ёпате## сору (ёлате *іп) { 
Спате *оиЕ = та110ос ($12е0Е (ёпате)); 
хоц = *іп; 
__ УМА АВбЅ ; 
гебогп оциё; 


} 


АРААР 


йе? орјесё сору (Ккеуча1) // После расширения получается показанная выше функция веуса! сору. 


Но устранение избыточности - не то, о чем следует печься в первую очередь. 
И хотя эстетическое чувство математика взывает к минимизации повторений и 
уменьшению количества текста на странице, иногда «лишний» код делает про- 
грамму более понятной и надежной. 
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С без зазоров 


В языке С единственный способ добавить новые элементы в структуру – обернуть 
ее другой структурой. Допустим, что имеется некий тип: 


фуредеЁ ѕігисі { 
} 1136 е1етепе_$; 


который уже включен в производственную систему и изменению не подлежит. 
А нам все же необходимо добавить новое поле — маркер типа. Тогда придется опре- 
делить новую структуру 
суредеЁ ѕігосі { 

1156 е1етепё ѕ ете; 


сһаг фуретагкег; 
} 1156 еїіетепе м буре 5; 


Плюсы: способ тривиальный, а скорость доступа сохраняется. Минусы: для 
обращения к имени элемента понадобится каждый раз выписывать полный путь 
усиг бурей 115#->е1тё->папе, тогда как при расширении класса в С++ иЈауа былобы 
достаточно написать уоиг К уред_115{->папе. Добавьте еще несколько слоев обертки, 
иэто станет надоедать. В разделе «Указатели без таПос» настр. 142 мы видели, как 
псевдонимы позволяют бороться с этой напастью. 

В С11 использование вложенных структур упрощено благодаря разрешению 
включать в структуру анонимные элементы. И хотя в стандарт эта возможность 
была добавлена только в декабре 2011 года, в компиляторе М!сгозой она была 
реализована гораздо раньше, а в 5сс для ее активации нужно задать флаг --тѕ- 
ехепѕіопѕ в командной строке. 

Синтаксис: включите какой-либо структурный тип в любое место объявле- 
ния новой структуры, как мы поступили со структурой ро1п\ в примере 11.6, но 
не задавайте имя этого элемента'. В примере 11.6 указано только имя структур- 
ного типа ѕігисі роіпё, тогда как именованное объявление имело бы вид ѕігосі 
роіпі еіепепёпате. Все элементы вложенной структуры включаются в новую 
структуру, как если бы они были объявлены непосредственно в обертывающей 
структуре. 

В примере 11.6 структура, описывающая точку на плоскости, расширяется до 
описания точки в трехмерном пространстве. Этот пример примечателен только 
тем, насколько естественно іћгеероіл расширяет ро1п\, – до такой степени, что 
пользователи структуры *Вгееро1п* даже не заметят, что ее определение основано 
на другой структуре. 


' Приведем цитату из стандарта С11 $6.7.2.1(13): «Безымянный член [гис или ипоп], 
для которого в качестве спецификатора типа указан структурный спецификатор без 
тега, называется анонимной структурой... Члены анонимной структуры или объедине- 
ния (ипіоп) считаются членами объемлющей структуры или объединения. Это правило 
применяется рекурсивно, если объемлющая структура или объединение сама является 
анонимной». 
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Пример 11.6 * Анонимная подструктура внутри обертывающей структуры 
естественно встраивается в обертку (ѕеатіеѕѕопе.с) 


#іпс1џае <5Еаіо.һ> 
#іпс10џае <таёһћ.һ> 


суреде? ѕігосе роіпе { 
аоџр1е х, у; 
} роіпё; 


бурейеЁ ѕёгисі { 
ѕігисі роіпё; © 
доџр1е 2; 

} Спгееро1пЕ; 


аоџр1е Епгее1епдЕй (ёһгеероіпё р) { 


геёогп заг®е(р.х*р.х + р.у*р.у + р.2*р.2); [2] 
} 
іп таіп () { 

Епгееро1пе р = {.х=3, .у=0, .2=4}; (3) 


ргіпёЁ ("р отстоит на%д единиц длины от начала координат\п", 
Єћгее1епдёћ (р)); 
} 


© Это анонимная подструктура. В неанонимной версии она имела бы имя, напри- 
мер ѕігисі роіпі море. 

Ө Поля хи уструктуры роілї выглядят и ведут себя в точности так же, как допол- 
нительное поле 2 структуры іћгеероілі. 

© Даже в объявлении нети намека нато, что х и у унаследованы от существующей 


структуры. 


В стандарте запрещается использовать їуредеї во вложенном анонимном объявлении. 

М Комитет по стандартизации явно отклонил эту возможность, создав тем самым одно из 
немногих мест в языке С, где псевдоним структурного типа не может заменить самого 
определения структуры". Впрочем, если вы применяете соглашение об именовании, опи- 
санное в разделе «Псевдонимы типов спешат на помощь», то это просто означает, чтонуж- 
но будет добавить слово ѕїгисі перед именем структурного типа. 


А теперь о приеме, благодаря которому этот механизм становится действитель- 
но полезным. В исходном объекте роіпї, скорее всего, имелся набор интерфейсных 
функций, потенциально все еще полезных, например функция Іеподїћ, возвращаю- 
щая длину от точки до начала координат. Как воспользоваться этой функцией, 
если у части большей структуры нет имени? 

Решение простое: взять анонимное объединение структур с именованной и 
неименованной частями роіпё. Поскольку структуры идентичны, то все их поля 
занимают в точности одинаковые позиции в объединении и отличаются только 


' Обсуждение взято из статьи Дэвида Кэмерона «С!апйсаНопз$ іо Апопутоиѕ З(гисигс$ 
апа Опіопѕ”, \/С14/ №1549, 22 декабря 2010 года. Голосование и одобрение состоялись па 
заседании комитета в марте 2011 года. 
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именами. Когда требуется вызвать функцию, работающую с исходной структурой, 
мы будем пользоваться именованной частью, а для органичного встраивания под- 
структуры в объемлющую структуру – анонимной. В примере 11.7 код из приме- 
ра 11.6 переписан с использованием этой идеи. 


Пример 11.7 * Структура роіпї органично встраивается в {Пгееро1п\, и унас 
по-прежнему есть имена, благодаря которым можно использовать функции, 
рассчитанные на роіпї (зеаптез$№о.с) 


#1пс1и4е <5аіо.һ> 
#1пс]иае <таёһћ.һ> 


фуредеЕ зегисе роіпе { 
аоџр1е х, у; 
} роіпі; 


СурейеЁ ѕігисі { 
опіоп { 


зігосі роіпі; © 
ро1пЕ р2; © 
}; 
аоцЬ]е 2; 


} Єһгеероіпё; 


аоџр1е Іепдёһ (роіпе р) { 
гебогп 59416 (р.х*р.х + р.у*р.у); 
} 


аоџр1е Ергее1епдЕв (Еһгеероіпё р) { 
геіцгп загё(р.х*р.х + р.у*р.у + р.2*р.2); 
} 


116 таіп () { 
Єһгеероіпё р = {.х=3, .у=0, .2=4}; 9 
рг1пЕЁ("р отстоит на%д единиц длины от начала координат\п", 
Єћгее1епдбһ (р)); 
аоџЬ1е ху1епдЕН = 1Іепдёһ (р.р2); ө 
ргіпеЁ ("Ее проекция на плоскость ХҮ отстоит на%д единиц длины " 
"от начала координат\п", хуІепдбһ); 


© Это анонимная структура. 

Ө Это именованная структура. Будучи частью объединения, она идентична ано- 
нимной структуре, отличаясь только наличием имени. 

Ө Структура роіпё по-прежнему органично включается в структуру іћгеероіпі, 
НО... 

Ө ... элемент р2 является именованным, каким всегда и был, поэтому мы можем 
использовать его для вызова интерфейсных функций, написанных для работы 
с исходной структурой. 


После объявления ћгеероіпї р мы можем ссылаться на координату Х как по 
имени р.х (из-за наличия анонимной структуры), так и по имени р.р2.х (из-за 
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наличия именованной структуры). В последней строке примера расстояние от 
проекции точки на плоскость ХУ до начала координат вычисляется с помощью 
Јеподёћ (р.р2). 

Начиная с этого момента, все возможности распространяются и на простран- 
ство ЌК?. Мы можем таким образом расширить любую структуру и продолжать 
пользоваться функциями, написанными для исходного объекта. 

Вы обратили внимание, что я впервые в этой книге употребил ключевое слово џпіоп? Объ- 
| единения - это одна из тех вещей, объяснить которые очень просто: это почти то же, что 
структура, только все элементы занимают одно и то же место в памяти, – но о подводных 
камнях можно написать несколько страниц. Память нынче дешева, и при разработке при- 
ложений нам нет нужды заботиться о выравнивании, поэтому лучше ограничиться струк- 


турами - это уменьшит шансы допустить ошибку, пусть даже в каждый момент времени 
используется только один элемент. 


Наследование нескольких структур таким способом – вещь рискованная. Вы- 
берите какую-нибудь одну структуру, которая станет базой расширения, восполь- 
зовавшись трюком с объединением, а остальные расширяйте с помощью обычных 
подструктур. Например, в библиотеке СМИ $аепийс Гагагу есть типы матрицы 
и вектора (причем для ѕігисі 95] маёхг1х имеется псевдоним 95] таїгіх). Предпо- 
ложим, что их надо поместить в одну структуру. 
фуредеЁ ѕігосі { //Увы, так не получится. 
ѕігосї 951 месіог; 


эбгосё 951 таЁгіх; 
} даба ѕеї; 


даба ѕеї а; 


Выглядит совершенно невинно, но лишь до тех пор, пока вы не обнаружите, что 
в обеих структурах 951 уесіог и 951 паёгіх имеется поле дака. На какой элемент 
Дака ссылается 4.да{а: из матрицы или из вектора? Не существует синтаксиса, по- 
зволяющего избирательно включать или переименовывать элементы структуры, 
поэтому лучшее, что можно сделать, – взять что-то одно (матрицу или вектор) 
за основу, а вторую структуру сделать вспомогательной, допускающей обращение 
к подэлементу только по имени: 


Сурейе# зігисї { // Вектор со вспомогательной матрицей 
$Егисе 951 уесіог; // Анонимная, органично встроенная 
зігис 951 таёгіх таёгіх; // Именованная 

} даба ѕеё; 


Стройте код на основе указателей на объекты 


В главе 10 были в основном представлены технические приемы, касающиеся структур 
данных, а не указателей на них, тогда как лейтмотивом этой главы является объявление 
и использование указателей на структуры. 

На самом деле если вы работаете с обычной структурой, то функции пем/сору/їгее по- 
лучаются автоматически: 


пем 
Пользуйтесь позиционными инициализаторами в первой же строке той части кода, 
где необходима структура. Дополнительный бонус: структуры можно объявлять на 
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этапе компиляции, так что они становятся доступны сразу же, без обращения к функ- 
ции инициализации. 


сору 


Для копирования достаточно знака равенства. 


Нее 


Не о чем беспокоиться; скоро структура покинет область видимости. 


Таким образом, работая с указателями, мы сами усложняем себе жизнь. И тем не менее 
есть общее мнение, что именно указатели следует класть в основу дизайна программ. 
Перечислим их преимущества. 


Копирование указателя обходится дешевле копирования структуры целиком, по- 
этому мы экономим микросекунду на каждом обращении к функции, принимающей 
структуру. Разумеется, это становится ощутимо только после нескольких миллиар- 
дов обращений. 

Все библиотеки для работы со структурами данных (к примеру, деревьями и связан- 
ными списками) написаны в расчете на указатели. 

Когда мы заполняем дерево или список, автоматическое уничтожение структуры по 
выходе из области видимости, в которой она была создана, отнюдь не всегда жела- 
тельно. 

Многие функции, принимающие структуру, модифицируют ее содержимое, а это 
означает, что без передачи указателя все равно не обойтись. Когда одни функции 
принимают структуру, а другие - указатель на структуру, возникает путаница (я сам 
писал такие интерфейсы и сожалею об этом), поэтому лучше уж всегда передавать 
указатель. 

Если какое-то поле структуры содержит указатель на данные, то все преимущества 
использования обычных структур улетучиваются: для выполнения глубокого копиро- 
вания (когда копируются не только указатели, но и данные, на которые они указыва- 
ют) потребуется функция копирования и, скорее всего, также функция освобожде- 
ния, гарантирующая уничтожение внутренних данных. 

Не существует правил использования структур, пригодных на все случаи жизни. Ког- 
да в процессе эволюции одноразовая структура, созданная для упрощения внутрен- 
них операций, становится основой организации данных, достоинства указателей вы- 
ходят на первый план, а достоинства структур как таковых отступают. 


Функции в структурах 


До сих пор мы во всех заголовках видели структуру и за ней набор функций, но 
ведь структура может включать указатели на функции в качестве членов, поэтому 
все функции, кроме орјесї пен, можно было бы перенести в саму структуру: 


СуредеЁ $зЕгисЕ Кеууа1 { 

сһаг *Кеу; 

уоіа *уа1џе; 

Кеууа1 * (*Кеууа1 сору) (Кеууа1 сопѕі *іп); 

уоіа (*Кеууа1 Ёгее) (Кеууа1 *іп); 

іпЕ (*Кеууа1 таёсћһеѕ) (Кеууа1 сопѕ *іп, сһаг сопѕі *Кеу); 
} Кеууа1; 


Кеууа1 *Кеууа1 пем (сһаг *Кеу, уоіа *уа11е); 


Отбрасывание указателя 


Допустим, имеется указатель на функцию їп, то есть * їп – это функция, а М – ее адрес 
в памяти. Тогда запись (* п) (х) осмысленна и означает вызов функции, но что могла бы 
значить запись Ёп (х)? В данном случае С следует подходу «делай, что я имел в виду» и 
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интерпретирует вызов указателя на функцию как обычный вызов функции. Для этого 
даже есть специальный термин - отбрасывание указателя (роіпїег десау). Именно по- 
этому в этой книге я трактую функции и указатели на функции одинаково. 


По большей части, это вопрос стиля, влияющий лишь на то, какмы ищем функ- 
ции в документации и как выглядит код на странице. Кстати, с точки зрения до- 
кументации я предпочитаю схему именования Кеууа] сору схеме сору Кеууа]: в пер- 
вом случае в алфавитном указателе все функции, ассоциированные с Кеууа1, будут 
собраны в одном месте. 

Реальное преимущество включения функций в саму структуру заключается 
в том, что таким образом становится проще изменить функцию, ассоциирован- 
ную с каждым экземпляром. В примере 11.8 показана простая структура списка, 
настолько общая, что в ней можно хранить рекламные объявления, тексты песен, 
кулинарные рецепты и вообще все, что угодно. Кажется естественным печатать 
столь различные типы списков в разном формате, поэтому мы должны иметь воз- 
можность определить несколько функций печати. 


Пример 11.8 * Довольно общая структура со встроенным методом печати 
(рип! фуредет.с) 
#1ЕпаеЕ 6ехе113е_$_П 
#ЧеЙпе Сехі1іѕі 5 һ 
СуредеЕ зегисе бехі115ѕЕ ѕ { 
сһаг *&1%1е; 
сһаг **ібетѕ; 
іпе 1еп; 
уоіа (*рг1пЕ) (5ЕгисЕ бехі11ѕе 5*); 
} бехе1іѕі 5; 
#епаі ғ 


В примере 11.9 с помощью этого псевдонима типа объявляются и используются 
два объекта. При создании объектов задаются различные методы печати. 


Пример 11.9 + Включение функции в состав структуры ясно показывает, 
какая функция с какой структурой используется (ргіпі_гпеіћоаѕ.с) 


#іпс1іџае <5ѕ6аіо.һ> 
#іпсіџаӢе "ргіпе ёуредеѓ.һ" 


збабіс уоіа ргіпё аа (сехё11ѕе 5 *іп) { 
ргіпіЁ ("ВОҮ ТНІ5%5!!!! Реабигез:\п", іп->6іб1е); 
Ғог (116 1=0; 1< іп->1еп; 1++) 
ргіпеЁ (": %5\п", іп->ібетѕ [1]); 


} 


збаёіс уоіа рг1пе_з0п9 (&ехе115_5$ *іп) { 
ргіпі# ("л%$ Л\пЬуг1с$:\п\п", 1п->61Е1е); 
Рог (1пЕ 1=0; 1< іп->1еп; 1++) 
ре1пЕЁ ("\6%5$\п", іп->ібетѕ [1]); 


} 


бехі1іѕі з зауе = {.6161е="СоЯ Ѕауе ёһе Оцееп", 
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.1еп=3, .ібетѕ= (сһаг* []) { 
"Тһеге'ѕ по Еибиге", "Мо Ёџёџге", "Мо Ёџёџге Ёог те." }, 
.ргіпё=ргіпё _зѕопд); © 


Сехі1іѕі ѕ репа = {.(1%1е="Меуег тіпа (пе Во11оскѕ ГР", 
.ібетѕ= (сһаг* []) {"Ву һе Ѕех Ріѕіо15", "АпЕ1-сопзитрЕ1оп ёћетеѕ"}, 


.1еп=2, .ргіпё=ргіпё аа); 


#і Ғпае# ѕкір таіп 


іп таіп () { а 
ѕаче.ргіпё (&за\е); 2, 
ргіпеЁ ("\п----- \п\п"); 


ѕрепа.ргіпі (&зрепа); 
} 
#епаі ғ 


© Обратите внимание: именно здесь функция включается в структуру, а несколь- 
кими строчками ниже то же самое делается для функции зрепд. 

Ө Вызовы всех методов, включенных в структуру, выглядят одинаково. Нам не 
нужно помнить, что зауе — это текст песни, а зрепд — рекламное объявление. 


Последние три строчки открывают путь к определению единообразного интер- 
фейса к совершенно различным функциям. Любая функция, принимающая указа- 
тель бехі115ї 5* в аргументе Ё, может выполнить такой вызов: {->рг1п* (60). 

Правда, есть и недостаток: мы рискуем нарушить правило, согласно которому 
вещи, предназначенные для разных целей, должны и выглядеть по-разному. Если 
какая-нибудь функция, сохраненная в поле ргіпї, имеет тонкие побочные эффек- 
ты, то никакого предупреждения вы не получите. 

Обратите внимание на ключевое слово з+а{1с, которое означает, что никакой 
код вне этого файла не сможет вызвать функцию ргіпі 5019 или ргіпї айпо имени. 
Однако ту и другую можно вызвать косвенно: зауе.рг1п{ или ѕрепі.ргіпі соответ- 
ственно. 

Хотелось бы добавить кое-какие «бантики». Во-первых, в записи зауе. 
рг1п (&зауе) два раза повторяется слово зауе. Было бы прекрасно, если бы мы мог- 
ли написать просто ѕаче.ргіпі (), а система догадалась бы, что первым аргумен- 
том должен быть объект, произведший обращение. Функция могла бы распозна- 
вать специальную переменную с именем 111$ или ѕе1# или можно было бы ввести 
в язык соглашение: компилятор переписывает орјесі. Ёп (х) в виде їп (орјесё, х). 

Увы, но это уже будет не язык С. 

В Снетникаких волшебных переменных, он честно говорит правду о том, какие 
параметры передаются функции. Обычно для манипуляций с параметрами функ- 
ции мы обращаемся к услугам препроцессора, который с большим удовольствием 
заменит Ё (апу{ №119) на Ё (апу 1119 е1зе). Однако все преобразования применяются 
к тому, что уже есть внутри скобок. Никаким способом нельзя заставить препро- 
цессор преобразовать 5.ргор (4) в 5.ргор ($, 9). Если вы готовы отказаться от раб- 
ского копирования синтаксиса С++, то можете написать такие макросы: 
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#аеѓіпе Ргіпё (іп) (іп) .ргіпЄ (віп) 
#аейіпе Сору (іп, ...) (іп) .сору( (іп), __ УА_АВС$ __) 
#аебпе Егее (іп, ...) (іп) .Ёгее( (іп), __УА_АВС$ __) 


Но теперь глобальное пространство имен засорено символами Ргіпі, Сору и Егее. 
Быть может, в вашем случае это и оправдано (особенно если учесть, что с любым 
объектом должны быть ассоциированы функции копирования и освобождения). 

Организация пространства имен должна быть продумана, так чтобы не было 
конфликтов имен, поэтому и макросы следует называть соответственно: 


#Аейпе Туре11$Е ргіпё (іп) (іп) .еѕёітабе (&1п) 
#аеѓіпе Туре1іѕі сору (іп, ...) (іп) .сору( (іп), __ ҮА АКСЅ5 ) 


Но вернемся к типу ёуре115ї _5. У нас есть способ распечатать тексты песен и 
рекламные объявления. Ну а как насчет кулинарных рецептов или еще чего-ни- 
будь? И что случится, если программист включит в структуру список, но забудет 
добавить нужную функцию? 

Необходим какой-то метод по умолчанию, и реализовать это легко с помощью 
функции диспетчеризации. Эта функция проверит наличие во входной структуре 
метода ргіпі, и если соответствующее поле отлично от МИЦ, то вызовет найденный 
метод. В противном случае она предоставит метод по умолчанию. В примере 11.10 
продемонстрирована такая функция диспетчеризации, которая правильно рас- 
печатывает объект песни с помощью включенного в него метода печати, но для 
рецепта, у которого метода печати нет, сама реализует простую печать по умолча-. 
нию. 


Пример 11.10 + У объекта гес1ре нет метода ргіпї, но функция диспетчеризации 
все равно распечатывает его (ргіпі_аіѕраїсћ.с) 


#аейпе ѕКкір таіп 
#1пс14е "ргіпе теёћоаѕ.с" 


Сехі1іѕї ѕ гесіре = ({.іё1е="Ѕбагііѕһ апа СоѓЁғее", 
.1еп=2, .іёетмѕ= (сһаг* []) { "Ѕёагііѕћһ", "СоЁғее" } }; 


уоіа ёехі1іѕї ргіпё (ёехі1іѕё з *іп) { 
іЁ (іп->ргіпё) { 
іп->ргіпё (іп); 
геигп; $ 


} 


ргіпі# ("Название : %5\п\пЭлементы: \п", 1п->11е); 
Рог (116 1=0; 1< іп->1еп; 1++) 
ре1пЕЁ ("\Е%5\п", іп->ібетѕ [1]); 


} 


іп таіп() { 
Сехі1іѕі ргіпё (&зауе); 
ргіпеЁ ("\п----- \п\п"); 


Сехі1іѕїі ргіпі (&гесіре); 


} 
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Таким образом, функции диспетчеризации предлагают процедуру по умолча- 
нию, разрешают проблему с отсутствием ключевого слова {11$ или зе1Ё и при этом 
устроены по аналогии с обычными интерфейсными функциями типа ех 115 сору 
или ќехі11ѕї Ёгее (если бы таковые были определены). 

Есть и другие способы достичь той же цели. Выше я использовал позиционные 
инициализаторы для заполнения структуры, поэтому незаданные элементы ока- 
зывались равными МЫ, и применение функции диспетчеризации имело прямой 
смысл. Если бы мы потребовали от пользователя создавать объект только с по- 
мощью функции {ех(115{ пем, то можно было бы установить в ней функции по 
умолчанию. Тогда исключить избыточность из конструкции ѕахе.ргіпё (&зауе) 
можно было бы с помощью простого макроса, как и раньше. 

Повторю - всегда есть разные варианты. У нас уже больше чем достаточно син- 
таксических средств для единообразного вызова различных функций при работе 
с различными объектами. Осталась трудная часть: написать эти различные функ- 
ции, так чтобы приединообразном вызове они вели себя, как ожидает пользователь. 


\У-таблицы 


Предположим, что с момента первоначального проектирования структуры 
ехі115ї з прошло некоторое время и возникли новые потребности. Хотелось бы 
иметь возможность публиковать списки во Всемирной паутине, но для этого их 
нужно представить в формате НТМГ. Как добавить новые функции печати в су- 
ществующую структуру? 

Мы уже видели (раздел «С без зазоров»), как можно расширять структуры, 
и эту идею можно использовать для организации вложенной структуры, содержа- 
щей новые функции. 

В этом разделе описывается альтернатива: добавлять новые функции вне 
структуры объекта. Они хранятся в так называемой виртуальной таблице (или 
о-таблице); название напоминает нам о виртуальных функциях из объектно-ори- 
ентированного лексикона, а также отдает дань памяти сложившейся в 1990-х годах 
моде называть виртуальным все, что реализовано программно. У-таблица пред- 
ставляет собой простую хэш-таблицу ключей и значений. В разделе «Реализация 
словаря» выше было показано, как построить такую таблицу, но сейчас я восполь- 
зуюсь хэшами из библиотеки СПЬ. 

По данному объекту я сгенерирую хэш (ключ) и ассоциирую с ним функцию. 
Затем, когда пользователь вызовет функцию диспетчеризации для некоторой опе- 
рации, эта функция поищет нужную операцию в хэш-таблице; если найдет, то вы- 
зовет ее, иначе выполнит действия по умолчанию. 

Вотчто нам понадобится для реализации этого плана. 

О Функция хэширования. 

О Средство проверки типов. Необходимо гарантировать, что сигнатуры всех 

функций, хранящихся в хэш-таблице, одинаковы. 

О Таблица ключей и значений и ассоциированные с ней функции добавления 

и поиска. 
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Функция хэширования 


Функция хэширования сопоставляет входному параметру число таким обра- 
зом, что вероятность получить одно и то же число для разных параметров близка 
к нулю. 

В библиотеке Сі есть несколько готовых функций хэширования, в том чис- 
лед дігесі һаѕһ, 9 іл һаѕһи 9 зїг һаѕһ. Первая (непосредственное хэширование) 
предназначена для указателей, она просто трактует указатель как результирующее 
число; в этом случае конфликт возможен, только если оба объекта занимают одно 
и то же место в памяти. 

В более сложных ситуациях можно написать функции хэширования самостоя- 
тельно. Ниже приведена широко распространенная функция, авторство которой 
приписывается Дэниэлу Дж. Бернстайну. Для каждого символа в строке (или каж- 
дого байта многобайтного символа ОТЕ-8) вычисленный ранее результат умножа- 
ется на 33 и к произведению прибавляется текущий символ (или байт). С высокой 
вероятностью произойдет переполнение переменной типа опѕідпей іпї, в которой 
хэш сохраняется, но это всего лишь еще один неявный детерминированный шаг 
алгоритма. 
збаіс ип$19пеа іле ѕегіпд һаѕһ (сһаг сопѕі *э%г) { 

опѕідпеа іпё һћһаѕһ = 5381; 
сһаг с; 


мр1]е ((с = *36г++)) Һаѕһ = һҺаѕһ*33 + с; 
геёогп ћаѕћ; 


Впрочем, СЬ уже предоставляет функцию 9 зг һаѕћ, так что использовать 
приведенную выше функцию необязательно. Однако ее можно взять за образец 
для написания альтернативных функций хэширования. Так, список указателей 
можно хэшировать следующим образом: 
ѕбаіс ипѕідпеа іпё рег 11іѕі һаѕһ (уоіа сопѕі **іп) { 

опѕідпеа іпё һћаѕһ = 5381; 

уоіа *с; 

мћһі1е ((с = *іп++)) Һаѕһ = Һаѕһ*33 + (и1пЕрег_Е)с; 
геёигп ћаѕћ; 


Для читателей с подготовкой в объектно-ориентированном программировании 
отметим, что мы уже прошли большую часть пути, ведущего к реализации мно- 
жественной диспетчеризации. Дайте мне два объекта, и я смогу вычислить сов- 
местный хэш-код указателей на них и ассоциировать с ним функцию в таблице 
ключей и значений. 

Для хэш-таблиц СІНЬ необходимо сравнение на равенство, поэтому библиотека 
включает функции сравнения 9 дігесї едџа1, 9 ілі едиа] и 9 їг едџа1, соответ- 
ствующие функциям хэширования. 

При любом выборе функции хэширования вероятность коллизий остается, хотя, 
если функция написана правильно, она близка к нулю. Я использую в своем коде 
функции хэширования, аналогичные вышеупомянутым, и сознаю, что в одии пре- 
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красный день кто-нибудь особо неудачливый может наткнуться на два набора ука- 
зателей, приводящих к коллизии хэша. Но решая, чему посвятить ограниченное 
время своего пребывания на Земле, я все-таки отдаю предпочтение поиску других 
ошибок, реализации полезных возможностей, шлифовке документации и личному 
общению – огромному большинству пользователей это принесет куда больше поль- 
зы, чем сведение вероятности коллизии к нулю. Сі полагается на хэш-коды для 
регистрации операций фиксации, а пользователи уже выполнили миллионы (или 
милларды?) таких операций, и тем не менее устранение коллизий хэша, похоже, 
стоит на самом последнем месте в планах людей, сопровождающих Сі. 


Проверка типов 


Мы хотим разрешить пользователям хранить произвольные функции в хэш- 
таблице и поручить нашей функции диспетчеризации поиск подходящей функ- 
ции и её использование предопределенным способом. Если пользователь напишет 
функцию, принимающую параметры неподходящих типов, то функция диспетче- 
ризации «грохнется», и пользователь разошлет во все социальные сети саркасти- 
ческие комментарии о неработоспособности вашей программы. 

В обычной ситуации, когда функция вызывается явно, типы параметров прове- 
ряются на этапе компиляции. С одной стороны, именно такую типобезопасность 
мы и теряем при динамическом выборе функции, но, с другой стороны, мы можем 
воспользоваться этим для проверки правильности сигнатуры функции. 

Предположим, что наши функции должны принимать параметры типа доџр1е* 
и іпё (например, список илиего длину) и возвращать структуру типа оџї їуре. Ее 
тип можно тогда определить следующим образом: 


СуредеЕ оиЁ Ёуре (*орјесі Ёп буре) (ЧочЬ1е *, іпё); 


Теперь определим ничего не делающую функцию-пустышку: 


уоіа орјесё Ёп буре сћһеск (орјесё Ёп Еуре іп) { }; 


В примере ниже она будет обернута макросом, чтобы пользователи гарантиро- 
ванно ее вызывали. Вызов этой функции возвращает нам типобезопасность: если 
пользователь попытается поместить в хэш-таблицу функцию с неправильными 
аргументами, то компилятор «ругнется» при попытке откомпилировать обраще- 
ние к функции-пустышке. 


Соберем все вместе 


В примере 11.11 показан заголовок, необходимый для реализации у-таблицы. 
Он содержит макрос для добавления новых методов и функцию диспетчеризации, 
которая производит поиск в таблице. 


Пример 11.11 < Заголовок для У-таблицы, ассоциирующей функции с объектами 
(ргіпі маЫе.п) 


#іпс1оде <911р.һ> 
#іпс1џае "рг1пЕ ёуредеѓЁ.һ" 
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ехіегп СНазВТаБ1е *рг1пЕ_Ёп$; 
СурейеЁ уоіа (*ргіпё Ёп буре) (Сехё1іѕї 5*); © 
уоіа сһеск ргіпе Ёп (ргіпе #п буре рЕ); 


#аеѓпе ргіпё һаѕһ ада (орјесё, ргіпё Ёп) { \ 2, 

сһеск ргіпё Ёп (ргіпё Ёп); \ 

9 Һаѕһ ёаһріе іпѕегі (ргіпё #пѕ, (орјесё) ->ргіпё, ргіпё Ёп); \ 
} 


уоіа бехі1іѕі ргіпё Һёт1 (ёехі115ѕ 5 *іп); 


© Это необязательно, но хороший іурейеЁ существенно облегчает работу с указа- 
телями на функции. 

Ө Уговаривать пользователей пользоваться функцией проверки типа — пустая 
трата времени, поэтому напишем макрос, который будет это делать за них. 


В примере 11.12 приведена функция диспетчеризации, которая на первом 
шаге производит поиск в У-таблице. Если не считать того, что просматривается 
у-таблица, а не сама входная структура, эта функция несильно отличается от по- 
казанного выше метода диспетчеризации. 


Пример 11.12 4 Функция диспетчеризации, работающая с виртуальной таблицей 
(рип маЫе.с) 


#1пс1и4е <50аіо.һ> 
#1пс1а4е "ргіпі уёар1е.һ" 


СбНаѕћТаріе *ргіпЄ Ёпз; © 
уоіа спеск_рг1пЕ Ёп (ргіпё Ёп буре рї) { } (21 


уоіа бехі1іѕі ргіпё Һёт1 (ехе115_$ *іп) { 
1Е (!ргіпЄ #пѕ) ргіпё Ёпѕ = 9 Һаѕһ бар1е пем (9 дігесї һаѕћ, © 
9_аігесё еаџа1); 


ргіпё Ёп буре рН = 9 һаѕһ баріе 1оокир (ргіпі Ёпѕ, іп->ргіпё); ө 
1Е (РВ) { 

РВ (іп); 

гебигп; 


ре1пЕЁ ("<Еіб1е>%5</6ібе>\п<01>", іп->біб1е); 
Ғог (іп 1=0; 1 < іп->1еп; 1++) 
ргіпЕЁ ("<11>%5</11>\п", іп->ібетѕ [1]); 
ргіпё# ("</ц1>\п"); 
} 


© Отметим, что хэш-таблица помещена в закрытую часть реализации, а не в от- 
крытый интерфейс. Пользователям работать с ней напрямую не придется. 
Ө Из всего представленного в книге кода это моя любимая функция. 
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© Инициализируем хэш-таблицы СПЬ, задавая функции хэширования и срав- 
нения на равенство. После того как они сохранены в структуре хэш-таблицы, 
пользователям уже не придется обращаться к ним явно. В этой строчке настраи- 
вается хэш-таблица функций печати, но при желании можно было бы настроить 
много других таблиц. 

Ө Метод ргіпё входной структуры можно использовать для того, чтобы понять, 
хранится ли в структуре текст песни, кулинарный рецепт или еще что-то, так 
что этот метод можно использовать для поиска подходящего метода печати 
в виде НТМГ-кода. 


И наконец, в примере 11.13 показано, как все это используется. Обратите вни- 
мание, что пользователь только вызывает макрос, чтобы ассоциировать специаль- 
ную функцию с объектом и зарегистрировать функцию диспетчеризации, которая 
выполняет всю содержательную работу. 


Пример 11.13 * Виртуальная таблица для ассоциирования функций с объектами 
(рип маЫе_из$е.с) 


#деѓіпе ѕКір таіп 
#іпс1іџдӢе "ргіпе тесһоаѕ.с" 
#іпсіџӣе "ргіпе уёар1е.һћ" 


ѕбаіс уоіа ѕопд ргіпё ВЕм1 (бехі1іѕе 5 *іп) { 
ргіпеЁ ("<Еіб1е>л%5 Л</Еіб1е>\п", іп->біб1е); 
Ғог (іпё 1=0; і < іп->1еп; 1++) 
ргіпеЁ ("%3<Ьг>\п", іп->ібетѕ([1і]); 


} 


11 таіп() { 
{ехе115 ргіпе ћітм1 (&зауе); 
ргіпеЁ ("\п----- \п\п"); 
ргіпі ћазһ ада (&ѕауе, зопд ргіпё ћет1); Ө 


Сехё1іѕі ргіпе һет1 (&зауе); 
} 


© Сейчас хэш-таблица пуста, поэтому будет вызван метод печати по умолчанию, 
встроенный в функцию диспетчеризации. 

Ө Здесь мы добавляем в хэш-таблицу специальный метод печати, поэтому при 
следующем обращении к функции диспетчеризации он будет найден и вызван. 


У-таблицы – это почти официальный механизм реализации многих средств 
в объектно-ориентированных языках, и ничего особо сложного в нем нет. В при- 
веденных выше примерах у-таблицам отведен едва ли десяток строчек!. И даже 
задание специальных функций для некоторых комбинаций объектов при такой 


' Поскольку сноски никто не читает, я, пожалуй, признаюсь в любви к т4, макроязыку, 


созданному в 1970-е годы. Наверное, на вашем компьютере он есть, потому что он 
используется в АиѓосопЁ Так вот, у этого вездесущего языка есть две уникальные и 
весьма полезные черты. Во-первых, он задумывался для поиска макросов в файле, 
написанном для совсем другой цели, например в скриптах оболочки, которые порождает 
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организации работает, что особенно ценно, поскольку не пришлось изобретать 
какой-то вычурный синтаксис для этой цели. Для реализации у-таблиц нужно не- 
много потрудиться, но зачастую это можно отложить до более поздней версии, 
когда они действительно понадобятся, а на практике их преимущества проявля- 
ются лишь при выполнении некоторых операций над некоторыми структурами. 


Область видимости " 


Область видимости переменной - это та часть программы, в которой эта перемен- 
ная существует и может использоваться. Разумный программист стремится макси- 
мально ограничить область видимости любой переменной, потому что тем самым 
уменьшается количество переменных, о которых нужно помнить в каждый момент 
времени, и снижается риск, что переменная будет изменена непреднамеренно. 

Засим сформулируем правила областей видимости в С. 

О Переменная не видна, пока не объявлена. Поступать иначе было бы странно. 

О Если переменная объявлена внутри фигурных скобок, то по достижении за- 

крывающей скобки она выходит из области видимости. Частичное исклю- 
чение: в циклах Еог и вфункциях переменные могут быть объявлены внутри 
круглых скобок до соответствующей открывающей фигурной скобки. 

О Если переменная объявлена вне фигурных скобок, то ее область видимости 

простирается от точки объявления до конца файла. 

Вот и всё. 

Не существует области видимости класса, прототипа, пространства имен, чле- 
нов-друзей, перепривязки среды времени выполнения и специальных ключевых 
слов и операторов, относящихся к областям видимости (за исключением уже 
упомянутых фигурных скобок и, пожалуй, спецификаторов компоновки ѕёаёіс и 
ехіегп). Вас смущает динамичность областей видимости? Не о чем беспокоиться. 
Если вы знаете, где находятся фигурные скобки, то можете легко понять, какие 
переменные в каком месте можно использовать. 

Все остальное – просто следствие. Например, если в файле соде.с имеется стро- 
ка #іпс10де <ћеадег.һ>, то весь текст файла леааеғћ включается в сойе.с, и находя- 
щиеся там переменные оказываются в соответствующей области видимости. 

Функции – частный случай области видимости внутри фигурных скобок. Сле- 
дующая функция суммирует все целые числа, не превосходящие значения ее ар- 
гумента: 


Аџќосопѓ, или в НТМГ-файлах, или в программах на С. По завершении макрообработки 
получается стандартный скрипт оболочки, НТМІ -файл или исходный файл на С без 
каких-либо следов т4. Во-вторых, на нем можно писать макросы, порождающие другие 
макросы. Препроцессор С такого делать не умеет. В одном проекте, где я заранее знал, 
что придется генерировать множество различных у-таблиц, я написал на 114 макросы, 
которые генерировали функции проверки типов, и обычные С-макросы. Объем 
избыточности в коде резко уменьшился, а поместив в таке ]е шаг обработки с помощью 
т4, я смог распространять код на чистом С. Никто не мешает и вам применить такую 
предварительную обработку исходного кода, потому что т4 есть повсюду. 
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106 зим (іп мах) { 
116 боба1=0; 
Ғог (іпё 1=0; 1<= мах; 1++) { 
Соёаї += і; 
} 


гебигп боѓа1; 


Переменные пах и {0{а1 видны внутри функции по правилу фигурных скобок 
с учетом частичного исключения, согласно которому переменные внутри круглых 
скобок до открывающей фигурной трактуются так, будто они объявлены внутри 
фигурных скобок. То же самое относится и к циклу Ёог: время жизни переменной 
і ограничено областью внутри фигурных скобок, охватывающих тело цикла. Если 
тело цикла Гог состоит всего из одной строки, то фигурные скобки необязательны, 
например ог (ілі 1=0; 1 <= тах; 1++) оба] += 1;, но область видимости і все равно 
ограпичена циклом. 

Подведем итог: язык С замечателен своими простыми правилами областей ви- 
димости, сводящимися, по существу, к поиску закрывающей фигурной скобки или 
конца файла. Объяснить всю эту систему начинающему можно минут за десять. 
Опытный автор может с успехом воспользоваться этими правилами для организа- 
ции дополнительных областей видимости в необычных ситуациях; такие приемы 
описаны в разделе «Выращивание устойчивых и плодоносящих макросов» в главе 8. 


Закрытые элементы структуры 


Итак, мы с облегчением очистились от всех дополнительных правил и ключевых 
слов, поддерживающих детальное управление видимостью. 

А можно ли реализовать закрытые элементы структуры без таких ключевых 
слов? В типичном объектно-ориентированном языке «закрытые» данные не шиф- 
руются компилятором, и вообще каких-то серьезных мер по их сокрытию никто не 
предпринимает: зная адрес переменной (например, ее смещение от начала струк- 
туры), мы можем создать указатель на нее, посмотреть на нее в отладчике и даже 
изменить. Технология для обеспечения такого ограниченного уровня закрытости 
у нас тоже есть. 

Типичный объект определяется в двух файлах: с-файл содержит детали реали- 
зации, а ^-файл включается туда, где объект используется. Почему бы не считать, 
что с-файл – это закрытая часть, а й-файл – открытая? Например, предположим, 
нам кровь из носу нужно сделать некоторые элементы объекта закрытыми. Тогда 
открытый заголовок мог бы выглядеть так: 
суредеЕ зігисі а рох з { 

іпЕ рор1іс ѕіге; 

уоіа *рг1уаее; 
ра рох 5; 

Указатель рг1уа{е пользователям практически бесполезен, потому что они не 
знают, к какому типу его приводить. А в закрытом файле а ђох.с мы определили 
бы и использовали соответствующий ќуредеѓ: 
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СуредеЕ зігосі ргіуабе рох ѕ { 
1оп9 аоор1е һом тисһ і Һабе ту роѕз; 
сһаг **сомогКегѕ і һауе а сгоѕћ оп; 
Ӣоџр1е Ёраде Ғасёог; 
} ргіуабе рох з; 


// Имея этот ѓіурейе}, мы можем привести указатель ртов к истинному 
// типу и воспользоваться им в файле а Бох.с. 


а рох ѕ *рох пем () { 
а рох ѕ *о0џє = та11ос(ѕігеоѓ (а рох 5)); 
ргіуабе рох ѕ *оџір = та110ос(ѕігеоЁ (ргіуаѓе рох ѕ)); 
хоџё = (а Бох 5) {.роирііс ѕі2е=0, .ргіуаіе=оџір}; 
гебигп оцЕ; 


уоіа рох еаії (а рох ѕ *іп) { 
ргіуасе рох ѕ *рЬ = іп->ргічаѓе; 
// теперь работаем с закрытыми переменными, например: 
рЬ->#џаде Ғасіог *= 2; 


Так что совсем нетрудно реализовать закрытую часть структуры в С, но я редко 
встречаю такую технику в реальных библиотеках. Немногие пишущие на С счита- 
ют, что это дает какое-то преимущество. 

Вот гораздо более разумный способ поместить закрытый элемент в открытую 
структуру: 
фуреаеЁ $ЕгисЕ { 

116 рир а, рир Ы; 
іпе ргічаёе а, ргімабе Б; // Закрыты: просьбы не пользоваться. 
} рир1іс з; Я 


Просто документируйте, что ничто не должно использоваться напрямую, и до- 
верьтесь пользователям. Если ваши коллеги неспособны последовать такой прос- 
той инструкции, то надо приковывать кофеварку цепью к стене, потому что ваши 
проблемы гораздо серьезнее тех, с которыми может справиться компилятор. 

Особенно просто сделать закрытыми функции: просто не помещайте их объ- 
явления в заголовок. Еще можно поставить перед определением ключевое слово 
зЕа{1с, чтобы пользователь уж точно знал - эта функция закрыта. 


Перегрузка 


У меня сложилось впечатление, что большинство программистов считает правило 
целочисленного деления - тот факт, что 3/2==1, – неудобным. Когдая пишу 3/2, то 
ожидаю получить 1. 5, а не единицу, черт бы ее побрал! 

И это действительно досадная черта С и других языков с целочисленной ариф- 
метикой, а в более широком контексте демонстрация опасностей, которые несет 
перегрузка операторов. Так называется явление, когда действие оператора, напри- 
мер /, зависит от типов его операндов. Если оба операнда – целые числа, то под- 
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разумевается деление с отбрасыванием дробной части, во всех остальных случа- 
ях — обычное деление. 

В разделе «Указатели без таос» я говорил, что предметы, обладающие различ- 
ными функциями, не должны быть похожи. В этом-то и заключается проблема 3/2: 
целочисленное деление и деление с плавающей точкой ведут себя по-разному, но 
выглядят одинаково. А отсюда путаница и ошибки. 

Естественный язык обладает избыточностью, и этохорошо, в частности потому, 
что помогает исправлять ошибки. Когда Нина Симон! поет «пе те диісќе раз» (до- 
словно это переводится «не оставляй меня не»), можно опустить как первое слово, 
потому что во фразе «...те ди! е раз» частица раз обозначает отрицание, так и по- 
следнее, потому что во фразе «пе те диіќќе ...» отрицание обозначается словом пе. 

Грамматический род обычно не несет большого смысла в реальных ситуациях, 
но иногда объект меняется в зависимости от выбора слова. Мой любимый при- 
мер – словае/ репе и [а роПа? в испанском языке, которые обозначают один итот же 
объект, но первое мужского рода, а второе женского. Истинная ценность рода со- 
стоит в том, что он обеспечивает избыточность за счет согласования частей пред- 
ложения, а значит, делает его смысл понятнее. 

Из языков программирования избыточность сознательно устраняется. Отрица- 
ние полностью меняет смысл выражения, но обычно выражается всего одним сим- 
волом (!). Однако род в языках программирования есть, и называется он типом. 
В общем случае глаголы и существительные должны быть согласованы по роду 
(как в арабском, русском, иврите и многих других языках). При наличии такой до- 
полнительной избыточности пришлось бы заводить функцию паёгіх по161ріу (а, 

р) для перемножения матриц и сопр1ех пи141р1у(а, 0) для перемножения ком- 
плексных чисел. 

Перегрузка операторов призвана устранить избыточность, дав возможность 
писать а * Б вне зависимости от того, что перемножается: матрицы, комплексные 
числа, натуральные числа и т. д. Приведу цитату из великолепного очерка о цене 
этой устраненной избыточности: «Видя в программе на С запись і = ј *5;, вы хотя 
бы знаете, что } умножается на пять и результат сохраняется в і. Но, глядя на точ- 
но такое же предложение в С++, вы не узнаете ничего»3. Проблема в том, что вы 
не знаете, что означает *, пока не посмотрите объявление типа ), не пройдете по 
цепочке наследования этого типа, чтобы выяснить, какая версия * имеется в виду, 
а потом не сделаете то же самое для і и не разберетесь, как оператор = соотносится 
с типами іи }. 

Вот какое правило перегрузки, с помощью бепегіс или иных средств, я вывел 
для себя: если пользователь ничего не знает о входном типе, сможет ли он все- 


Американская певица, пианистка, композитор, аранжировщица. — Прим. перев. 
Любознательному читателю не составит труда найти перевод самостоятельно. Намекну 
лишь, что в русском ситуация в точности аналогична, только эти слова обозначают не 
совсем одно и то же. – Прим. перев. 

Первоначально на странице ВЕр:/ мум јоеіопѕоЌмаге.сот/агііс[еѕ/Мгопе.һеті. Повто- 
репо в книге [Зро][$Ку 2008, стр. 192]. 
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таки прийти к правильному выводу? Например, перегрузка абсолютной величины 
для ілі, Поаї и доџр]е согласуется с этим правилом. В библиотеке СМИ Заепийс 
ГАЬгагу имеется тип 951 _ сопр]ех для представления комплексных чисел, тогда как 
в стандартном С есть тип сопр1ех доче и ему подобные; имеет смысл перегрузить 
функции, работающие с этими типами, так чтобы они вели себя одинаково. 

Как мы видели в предыдущих примерах, С в целом придерживается описанных 
выше правил «согласования рода»: 
// сложить два вектора из библиотеки СМИ 5с1епЕ1Нс Ііргагу 


951 месіог *у1, *у2; 
951 уесіог ааа (у1, х2); | 


// открыть канал ввода-вывода СГ1ЛЬ для чтения указанного файла 
СЕггог *е; 
СІОСһаппе1 *Ё = д іо сһаппе1 пем_Н1е ("іпааба.сѕу", "г", ве); 


Кода получается больше и когда подряд идет 10 строк, в которых упоминается 
одна и та же структура, создается впечатление о чрезмерном изобилии повторов, 
зато назначение каждой строки не вызывает никаких сомнений. 


_@епейс 


В языке С имеется ограниченная поддержка перегрузки с помощью ключевого 
слова бепегіс. Оно вычисляет значение в зависимости от типа входного аргумен- 
та, что позволяет писать макросы, консолидирующие несколько типов. 

Не зависящие от типа функции нужны, когда типов слишком много. В неко- 
торых системах предлагается обширный перечень точных типов, но ведь каждый 
из них нужно поддерживать. Например, в библиотеке СМИ Заепийс 1Ьгагу есть 
тип комплексного числа, комплексного вектора и просто вектора - и это при том, 
что в С тоже имеется тип сопр1ех. Если принять во внимание все комбинации этих 
четырех типов, то теоретически понадобится 16 функций. В примере 11.14 выпи- 
саны некоторые из них; если вы не из числа приверженцев комплексных векторов, 
то этот пример, скорее всего, покажется вам полной невнятицей, и вы захотите 
поскорее узнать, как его можно причесать. 


Пример 11.14 + Вот так делается колбаса - для тех, кого интересуют 
комплексные типы из библиотеки С (сотріех.с) 


#іпс1џае "ср1х.ћ" //951 ср1х Ёгот с99; см. ниже. 
#1пс104е <951/951 Б1азѕ.һ> //951 Б1аѕ ааоё 
#1пс104е <951/951 сотр1ех таёһћ.һ> //951 сотр1ех ти] ( геа1) 


951 уесіог сотр1ех *суес дої 951ср1Іх (951 уесіог сотр1ех *у, 951 сотр1ех х) { 
951 уесіог сотріех *оџі = 951 уесіог сотр1ех а11ос(у->ѕіге); 
Ғог (116 1=0; 1< у->5і2е; 1++) 
951 уесіог сотр1ех ѕеї (оцё, і, 
951 _сотр1Іех ти1 (х, 951 уесіог сотр1ех деб (у, 1))); 
гебигп оці; 


} 


951 уесіог сопр1Іех *уес дої 9ѕісріх (951 уесёог *у, 951 сотр1ех х) { 
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951 месіог сотр1Іех *о0џє = 951 уесбог сотр1ех а110ос(у->ѕіге); 
Ғог (116 1=0; 1< \->512е; 1++) 
951 уесіог сотр1іех ѕеї (ооё, і, 
951 сотр1Іех тиі геа1 (х, 951 чесіог деб (у, 1))); 
геогп оиб; 


} 


951 уесеог_сотр1ех *суес дої с(951 уесіог сотр1Іех *у, сопр1ех аоце х) { 
гееигп суес до 9ѕ1іср1х (у, 951 ср1Іх Ёгот с99(х)); 


} 


951 уесеог_сотр1ех *уес ої с(951 месіог *у, сотр1ех доче х) { 
геёцгп чес оі 9ѕ1ісріх (у, 951 ср1х Ёгот с99(х)); 


} 
сопр1ех аоџЬ1е айо (сотр1ех оџр1е х, сотр1ех оџЫ1е у) {гефигп х*у;} ®© 


уоіа 951 месіог сотр1ех ргіпіё (951 уесіог сотр1ех *у) { 
Ғог (іп 1=0; 1< у->5і2е; 1++) { 
951 сотр1ех х = 9451 чесбог сотр1ех де (у, 1); 
ргіпе# ("%9+%491%с", 651 КЕАІ (х), С5Ъ ІМАС (х), 
1 < \->512е-1 ? "\0' : '\п'); 


} 


© Для перемножения чисел, имеющих встроенный в С тип сопр1ех, достаточно 
просто знака *, каки для вещественных чисел. 


Чтобы это «причесать», нужен заголовок, показанный в примере 11.15. В нем 
ключевое слово бепегіс используется для выбора одной из приведенных выше 
функций в зависимости от типа входного аргумента. Первый аргумент (управляю- 
щее выражение) не вычисляется, бепегіс просто проверяет его тип и выбирает со- 
ответствующее выражение. Мы хотим выбирать функцию в зависимости от двух 
типов, поэтому первый макрос решает, какой – второй или третий – макрос ис- 
пользовать. 


Пример 11.15 * Использование бепег1с для внесения порядка в хаос (сріх.ћ) 


#1пс1а4е <сотр1ех.һ> // хорошие имена для комплексных типов С 
#іпс1џае <951/951 уесіог.һ> //95] уесёог сотр1ех 


951 уесёог сотр1ех *суес дої 9ѕ1ср1х (951 уесіог сотр1Іех *у, 951 сопр1ех х); 
951 месіог сотр1Іех *уес до 951ср1х (951 уесіог *у, 951 сотр1ех х); 

951 уесёог сотр1ех *суес до с(951 чесёог сотрІех *у, сотр1ех доцЫ]е х); 
951 уесёог сотр1ех *уес ої с(951 уесіог *у, сотр1ех ПоџЫ1е х); 

уоіа 951 чесіог сопр1Іех ргіпіё (951 уесіог сотр1ех *у); 


#аеѓіпе 951 ср1Іх Ёгот с99(х) (951 сотр1Іех) {.ӣаё= {сгеа1 (х), сітад (х) }} © 
сопр1ех Чоию1е айо (сотр1ех 4оцЬ1е х, сотр1ех доц Ь1е у); 


#аеѓіпе доѓ (х,у) _Сепегас ((х), ` ө 
951 муесіог*: дої дічеп мес (у), \ 
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951 уесёог сотр1ех*: ої діуеп ср1х мес (у), \ 
аӢеҒаџ1є: адо) ( (х), (у)) 


#аеііпе аоё діуеп чес(у) _Сбепегіс( (у), \ 
951 сотр1іех: уес ої 951сріІх, \ 
деҒаџ1: уес ої с) 


#Аейпе дої діуеп ср1х уес (у) _бепегіс ( (у), \ 
951 сотр1ех: суес дої 9ѕ1срі1х, \ 
деҒаџ1ї: суес Яо с) 


© Типы 951 сопр]ех и сотр1ех іоџр1е из стандарта С99 представляют собой массив 
из двух элементов типа йоџр1е: вещественной и мнимой частей [см. руководство 
по СУГ, а также С99 и С11 $6.2.5(13)]. Нам остается только определить под- 
ходящую структуру, а для построения ее на лету есть идеальное средство - со- 
ставной литерал. 

Ө При первом использовании аргумент х не вычисляется, только проверяется его 
тип. Это означает, что при обращении вида ої (х++, у) инкремент х производит- 
ся лишь один раз. 


В примере 11.16 жизнь снова становится прекрасной (по большей части): мы 
можем воспользоваться макросом йо для перемножения 951 үесіог и 951 сопр]ех, 
951 уеског сопр]ех и комплексного числа в смысле С и вычисления прочих много- 
численных комбинаций. Разумеется, знать выходной тип по-прежнему необходи- 
мо, таккак результатом перемножения двух скаляров является скаляр, а не вектор, 
поэтому порядок использования результата зависит от входных типов. Комби- 
наторный взрыв из-за изобилия типов — болезнь серьезная, но ключевое слово 
_ бепег1с дает хоть какое-то лекарство. 


Пример 11.16 + Награда: мы можем использовать макрос ої, не обращая 
внимания (ну, почти) на типы входных аргументов (ѕітріе_сріх.с) 


#іпс1џае <5Е41о.Н> 
#іпсіџае "ср1х.в" 


116 ма1п() { 
іпЕ сотр1ех а = 1+21; © 
сотр1ех ЧоцЬ]е Ь = 2+1; 
951 сотр1ех с = 951 ср1х Ёгот с99(а); 


951 уесіог *у = 951 месіог а110с(8); 
Ғог (іп 1=0; 1< у->ѕіғе; і++) 931 уесфог ѕеб (у, і, 1/8.); 


сотр1ех йоџр1е адо®Ь = Яоё (а, ЬЫ); ө 
ргіпіЁ ("(1+21) ао (2+1) :%9 +%91\п", сгеа1 (айоёЬ), сітад (айоёЫ)); Ө 


ргіпіё ("у ао 2:\п"); 
доџЬ1е а = 2; 


951 уесёог сотр1ех ргіпё (аої (у, а)); 


ргіпЕЁ ("у ао (1+21) :\п"); 
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951 уесбог_сотр1ех *ус = Яо (у, а); 
951 уесёог сотр1ех ргіпё (ус); 


ргіпёЁ ("у ао (1+21) ада1т:\п"); 
951 уесёог сотр1іех ргіпё (аоЄ (у, с)); 


} 


© Объявления, содержащие сопр]ех и сопѕї, в чем-то похожи: допустимо как 
сопр1ех іпї, так и ілі сопр]ех. 

Ө И вот, наконец, долгожданная награда: здесь макрос 40{ используется четыре 
раза с аргументами различных типов. 

© Это встроенные в С средства получения вещественной и мнимой частей комп- 
лексного числа. 


Подсчет ссылок 


Оставшуюся часть этой главы мы посвятим нескольким примерам добавления 
подсчета ссылок в стереотипные функции создания, копирования и освобожде- 
ния. Поскольку сам по себе подсчет ссылок - не такое уж сложное дело, мы прида- 
дим изложению интерес, рассмотрев содержательные примеры с учетом реальных 
проблем, возникающих на практике. Но, несмотря на все интересные расширения 
и варианты, рабочей лошадкой, встречающейся в большинстве реальных библио- 
тек на С, остается структура, дополненная функциями. 

В первом примере мы рассмотрим небольшую библиотеку всего с одной струк- 
турой, назначение в которой – прочитать весь файл в строку. Закачать весь текст 
романа «Моби Дик» в строку в памяти – не проблема, но хранение тысяч копий 
этойстроки – расточительство. Поэтому вместо копирования потенциально длин- 
ной строки данных мы будем хранить представления, в которых запоминаются 
только начало и конец. 

Коль скоро может существовать несколько представлений строки, освобождать 
строку разрешается только тогда, когда не останется ни одного связанного с ней 
представления. Благодаря инфраструктуре объектов решить эту задачу несложно. 

Во втором примере, основанном на агентах микромодели формирования групп, 
имеется похожая проблема: пока в группе есть члены, она должна существовать, 
а освобождать отведенную группе память можно только после того, как ее покинет 
последний член. 


Пример: объект подстроки 


Чтобы несколько объектов могли указывать на одну и ту же строку, мы добавим 
в структуру еще один элемент - счетчик ссылок. Ниже описано, как следует моди- 
фицировать четыре стереотипных элемента. 

О В определение типа включается указатель на целое геё5. Он инициализи- 
руется только один раз (в функции пен), а все копии (созданные функцией 
сору) разделяют саму строку и счетчик ссылок. 

О Функция пен инициализирует указатель геЁз и присваивает *геЁз = 1. 
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О Функция сору копирует входную структуру в выходную и увеличивает счет- 
чик ссылок на 1. 
О Функция Ёгее уменьшает счетчик ссылок на 1 и, если он обращается в нуль, 
освобождает память, выделенную разделяемой строке. 
В примере 11.17 показан заголовок Ё5#.Й, в котором определены основная струк- 
тура для представления участка строки и дополнительная структура для пред- 
ставления списка таких участков. 


Пример 11.17 < Открытая верхушка айсберга (#ѕїг.һ) 


#іпс10џае <35Е41о.в> 
#іпс10џае <5&4116.8> 
#1пс1иае <911іБ.һ> 


СуредеЕ зегисе { о 
сһаг *ааќа; 
ѕіге Е заг, епа; 
іпё* геЁз; 

} Ёѕёг 5; 


Еѕіг ѕ *Ёѕіг пем (сһаг сопѕі *Н1епапе); 

Ёѕіг 5 *Езёг сору(#ѕёг 5ѕ сопѕі *іп, 312е Е багі, ѕіғе Е 1еп); 
уоіа Ёѕёг ѕһом (Ёѕіг 5 сопѕі *Ёѕіг); 

уоіа Ёѕіг Ғгее (Ёзіг ѕ *іп); 


суредеЕ зегисЕ { ө 
Ёѕіг ѕ **5гіпдзѕ; 
іп соипЕ; 

} Ёѕёг 1150; 


Еѕіг 1150 Ёѕіг ѕр11Є (Ёѕг ѕ сопѕі *іп, дсһаг сопзі *ѕіагі раёёегп); 
уоіа Ёѕіг 11ѕі Ёгее (Ёѕіг 115ѕЕ іп); 


© Надеюсь, что эти стереотипные повторения ќурейеѓ/пем/сору /гее стали уже 
привычными. Функция Ёѕіг ѕћою очень полезна для отладки. 

Ө Это вспомогательная структура, а не полноценный объект. Обратите внимание, 
что функция Ёѕіг 5р11ї возвращает список, а не указатель на список. 


В примере 11.18 приведен код библиотеки /ѕѓёс. В нем мы пользуемся имею- 
щимися в СІ4Ь средствами для чтения текстового файла и разбора совместимых 
с Рег] регулярных выражений. Цифры соответствуют шагам, перечисленным в на- 
чале этого раздела, чтобы вам было проще следить за тем, как поле геЁз использу- 
ется для реализации подсчета ссылок. 


Пример 11.18 < Объект, представляющий подстроку (їѕіг.с) 


#іпсіџдӢе "Езег.В" 
#іпс1џде "ѕігіпад обі11біеѕ.ћ" 


Еѕіг ѕ *Ёѕіг пем (сһаг сопзЕ *!1епате) { 
Ёѕг ѕ *оџё = та11ос(ѕігеоЁ (Ёѕёг ѕ)); 
*оцЕ = (ЁѕЕг 5) {.ѕбагі=0, .геЁѕ=та110с (5312ео (іпё)) }; 


Ф, 
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оцЕ->Чафа = ѕегіпд Ёгот #1е (й1епате); 

о0цЕ->епа = оџё->ӣаѓа ? ѕіг1еп (оџі->даѓа): 0; 

жоце->геЁѕ = 1; © 
гесигп ое; 


} 


Езёг_з *Езег сору (Ёѕг ѕ сопѕі *іп, ѕіге ё ѕёагі, ѕіге Ё 1еп) { ө 
Ёѕіг 5 *о0Ё = та11ос(ѕ5і2еоЁ (#ѕёг ѕ)); 
хоці=*іп; 


ооЕ->ѕіагі += ѕіагі; 
1Е (іп->епа > ооё->ѕёаге + 1еп) 
.оці->епа = оці->ѕіёагі + 1еп; 
(*оцЕ->геЕ5) ++; © 
гебигп оці; 


} 


уоіа ЁЕзЕг_Ёгее (Ёѕіг ѕ *іп) { ө 
(*іп->геЁѕ)--; 
іЁ (1*1п->геё$) { 
Егее (іп->ааѓа); 
Егее (іп->геЁѕ); 
} 
Ғгее (іп); 


} 


Еѕег 1150 Е56г_ зр11е (Е356г_5 сопѕі *іп, дсһаг сопзЕ *ѕбагі рабёегп) { 
1Е (!іп->дӢаба) геёогп (#ѕег 1іѕё) { }; 
ЕѕЕг 5 **оџі=та110с (ѕігеоЁ (Ёѕіг 5*)); 
іп оџб1еп = 1; 
сиё [0] = ЕзЕг_сору(1п, 0, 1п->епа); 
СВедех *ѕіагі гедех = 9 гедех пем (ѕёагі расегп, 0, 0, №11); 
діпё тѕбагё=0, тепа=0; 
Ёѕіг ѕ *гетаіпіпд = Ёѕіг сору (іп, 0, іп->епа); 
ао { © 
СМаесйТпЕо *ѕбаге іпЁо; 
9_гедех таёсћ (ѕіагі гедех, &гетаіпіпд->ааса[гетаіпіпд->ѕїаге], 
0, &зкаге 1160); 
9 таёсһ іпЁо Ёесһ роѕ (ѕіагі іпЁо, 0, &тѕёагі, &тепа); 
9 таёсһ іпЁо Ёгее (ѕіаге іпғо); 
1Е (тепа > 0 && тепа < гетаіпіпд->епа - гетаіпіпд->ѕбагі) { © 
оцЕ = геа11ос (оці, ++оџі1еп * ѕігеої (Ёѕіг 5ѕ*)); 
ооё [о0Е1еп-1] = Ёѕёг сору (гетаіпіпд, тепа, гетаіпіпд->епа-тепа); 
оц [оцЕ1еп-2] ->епа = гетаіпіпа->ѕбќагё + тѕбагі; 
гетаіпіпд->ѕёагё += тепа; 
} е1зе Ьгеак; 
} мһі1е (1); 
Еѕг Ғгее (гетаіпіпд); % 
9_гедех ипгеЁ (ѕбќагі гедех); 
геіџгп (Ёѕбг 1156) {.5ігіпдѕ=оџі, .соџпё=о0С1еп); 


} 


уоіа Ёѕёг 115 Ғгее (Ёѕіг 1156 іп) { 
Ғог (іпё 1=0; 1< іп.соцпі; 1++) { 
Еѕіг Ғгее (1п.56111095[1]); 
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} 
Егее (іп.ѕігіпдѕ); 


} 


уоіа ЕзЕг_зПом (Ёзіг ѕ сопѕі *Е$ег) { 
ргіпеЁ ("%.*5", (іп) Ёѕёг->епа-Ёѕг->ѕбагі, &Ёѕіг->ааба [#ѕёг->ѕбагі]); 


} 


© Для нового объекта Ёѕїг 5 счетчик ссылок устанавливается в 1. Строки, пред- 
шествующие этой, стереотипны. 

Ө Функция сору копирует переданную ей структуру Е5г_5 и устанавливает по- 
зиции начала и конца подстроки (проверяя, что конец не дальше конца входной 
структуры Е54г $). 

Ө Здесь увеличивается счетчик ссылок. 

© Здесь счетчик ссылок используется — мы решаем, нужно освобождать исход- 
ную строку или нет. 

Ө В этой функции используются совместимые с Рег! регулярные выражения для 
разбиения входной строки на участки. Как сказано в разделе «Разбор регуляр- 
ных выражений» на стр. 321, сопоставитель (тассһег) определяет участок стро- 
ки, соответствующий переданному регулярному выражению, после чего мы 
с помощью Ёѕїг сору можем получить копию этого участка. Затем мы пытаемся 
выделить следующий участок, выполнив те же действия с позиции, следующей 
за концом предыдущего участка. 

© Впротивном случае соответствие не найдено, или мы дошли до конца строки. 


И наконец, само приложение. Для этого нам понадобится текст романа «Моби 
Дик, или Белый кит» Германа Мелвилла. В примере 11.19 показано, как скачать 
его с с сайта проекта Гутенберг. 


Пример 11.19 * Используем сип для получения текста «Моби Дика» с сайта 
проекта Гутенберг, затем с помощью ѕеа вырезаем начало и конец, присутствующие 
в любом скачанном с этого сайта файле. При необходимости установите сигі 

с помощью менеджера пакетов (#їпа.тобу) 


1Е [! -е тору ] ; еп 
сиг1 һер: //вии. диёепЬегд. огд/сасве/ериЬ/2701/р92701.ЕхЕ \ 
| зеа -е ‘'1,/5ТАКТ ОЕ ТНІЅ РКОЈЕСТ СОТЕМВЕБС/а” \ 
| зеа -е '/Епа оѓ Ргојесё биёепЬега/, $ а’ \ 
> поБу 


й 

Получив текст книги, программа из примера 11.21 разбивает его на главы и, 
применяя ту же самую функцию разбиения, подсчитывает, сколько раз в каждой 
главе встречаются слова оћа/е(ѕ) и І. Обратите внимание, что в этом месте струк- 
туры Ех можно рассматривать как непрозрачные объекты, из которых использу- 
ются только функции пем, сору, {гее, ѕћом и ѕрііє. 

Для этой программы необходимы библиотека СІ4Ь, файл /ѕѓ.с и утилиты ра- 
боты со строками, разработанные ранее. Таким образом, таке е выглядит, как 
показано в примере 11.20. 
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Пример 11.20 < Простой такейе для программы изучения китов (сеїоіоду. таке) 


Р=себо1оду 

СЕ1АС5= `ркд-сопід --сЙад$ 911р-2.0` -9 -Ма11 -$&4=9пи99 -03 
Ір1В5= `рко-сопід --1ірѕ 911ір-2.0` 

орјесёѕ=Ёзіг.о ѕігіпд оіі1ібіеѕ.о 


$(Р): $ (орјесёѕ) 


Пример 11.21 + Книга разбивается на главы, и для каждой главы подсчитываются 
некоторые характеристики (сеїоіоду.с) 


#іпс10џае "ЁѕЕг.һ" 


116 маіп () { 

Еѕіг ѕ *Ёѕіг = Ёѕіг пем ("тору"); 

ЕзЕг 1156 сһарёегѕ = Ёѕіг эр1і (Ез, "\пСНАРТЕК"); 

Еог (116 1=0; 1< сһарёегѕ.соцпі; 1++) { 
Езег 1136 Ёог һе ісІе=Ёѕіг 5р1і (сһарбегѕ.ѕбгіпдѕ [і], "\\."); 
ЕѕЄг ѕћом (Ёог ће біб1е.ѕігіпд5[1]); 
Ёзег 1іѕі те = Ёзег зр1ії (сһарёегѕ.зёгіпдз(і), "\\ит\\и"); 
ЕѕЕг 115 мһа1еѕ = Ёѕіг 5ѕр11іЄ (сһаріегѕ.зігіпдѕ[1], "мһа1е (51|) "); 
ЁѕСг 115 могӣѕ = Ёѕіг 5ѕр1іЄ (сһарёегѕ.ѕбгіпдѕ [і], "\\И"); 
ргіпеё ("\псһћ%і, могаѕ:%і.\Е 15: %і \мһа1еѕ:%і\п", 1, могаѕ. соцпё-1, 

ме.соип*-1, мһа1еѕ.соцпі-1); 

ЕѕСг 1150 Егее (Ғог һе біб1е); 
ЕѕЕг 115 Егее (те); 
ЕѕСг 1156 Егее (мпа1ез); 
Еѕіг 1150 Егее (могаѕ); 


} 
ЕѕЄг 1156 Егее (сһарёегѕ); 
ЕѕЕг Ғгее (ЁѕЄг); 


} 


Чтобы у вас был стимул попробовать эту программу, я не стану полностью вос- 
производить результаты. Но сделаю несколько замечаний, из которых станет по- 
нятно, кактрудно было бы Мелвиллу опубликовать или хотя бы разместить книгу 
в блоге в наши дни: 

О длины глав различаются на порядок; 

О киты почти не упоминаются вплоть до главы 30; 

О рассказчик определенно обладает собственным голосом. Даже в знаменитой 
главе о цетологии местоимение «я» употребляется 60 раз, что придает лич- 
ный характере тексту, который в противном случае можно было бы принять 
за статью из энциклопедии; 

О имеющийся в СТА анализатор регулярных выражений оказался несколько 
медленнее, чем я рассчитывал. 


Пример: основанная на агентах модель формирования групп 

Здесь мы рассмотрим пример основанной на агентах модели членства в группе. 
Агенты берутся из двухмерного пространства предпочтений (поскольку мы будем 
представлять группы графически), а точнее, квадрата с противоположными вер- 
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шинами в точках (-—1, –1) и (1, 1). В каждом раунде агенты будут присоединяться 
к группе с наибольшей полезностью. Полезность группы для агента вычисляется 
как —(расстояние до средней позиции группы + М*количество членов). Средняя 
позиция группы определяется как среднее арифметическое позиций ее членов (за 
исключением агента, опрашивающего группу), а константа М характеризует жела- 
ние агентов оказаться в большой группе, по сравнению с их заинтересованностью 
в близости к средней позиции группы: если М близко к нулю, то размер группы 
практически безразличен, а агентов интересует только близость; если же М стре- 
мится к бесконечности, то позиция становится несущественной, а значение имеет 
только размер группы. 

При определенном стечении обстоятельств агент формирует новую группу. Но 
поскольку агенты заново выбирают себе группу в каждом раунде, может случить- 
ся, что в следующем раунде агент покинет первоначально выбранную группу. 

Задача подсчета ссылок похожа на ранее рассмотренную, да и вся процедура 
в целом аналогична: 

О в определении типа имеется целочисленное поле соџпїег; 

О функция пем присваивает соџпѓег = 1; 

О функция сору выполняет соџпёег++; 

О функция Етее проверяет условие ії (--соџпіег==0), и если оно истинно, то 
освобождает все разделяемые данные, в противном случае она оставляет все 
как есть, потому что еще остаются активные ссылки на структуру. 

Поскольку все изменения структуры инкапсулированы в интерфейсных функ- 
циях, при работе с этим объектом думать о выделении памяти не придется. 

Программа моделирования занимает почти 125 строк, а поскольку для ее доку- 
ментирования я пользовался СМЕВ, то размер чуть ли не удваивается (см. раздел 
«Грамотное программирование с помощью СУ\/ЕВ», где приведены рекомендации 
по поводу работы с СУУЕВ). Благодаря выбранному стилю код должен быть со- 
вершенно понятен; даже если вы предпочитаете пропускать большие куски кода, 
просмотрите его хотя бы мельком. Если у вас под рукой имеется СМЕВ, можете 
сгенерировать документацию в формате РПЕ и почитать ее. 

Предполагается, что выход этой программы будет подан на вход Спиріоѓ – про- 
граммы построения графиков, которую исключительно легко автоматизировать. 
Ниже приведен командный скрипт, в котором Спиріоє передается встроенный до- 
кумент, содержащий последовательность данных (е обозначает конец последова- 
тельности). 
саб << "------ " | 9пор1оё --регѕіѕі 
зеё х1аБе1 "Үеаг" 
зеё у1аЪе1 "0.5. Ргез1ЧепЕ1а1 е1есЕ1опз" 
зеЕ угапде [0:5] 
ѕе Кеу оЕЕ 
р1Іоб '-' м1ЕВ Бохез 
2000, 1 
2001, 0 


2002, 0 
2003, 0 


к? 
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Вероятно, вы уже понимаете, как можно сформировать команды Спиріоё из 
программы, воспользовавшись несколькими вызовами ргіпії для задания настро- 
ек и циклом Еог для вывода набора данных. Кроме того, если передать Спиріо 
несколько графиков, то будут сгенерированы кадры анимации. 

Приведенная далее модель порождает такую анимацию, которую можно 
отобразить на экране командой . /дгопрз | 9пир10ї. Напечатать результат анимации 
на страницах книги сложновато, так что вам придется выполнить программу само- 
стоятельно. Вы увидите, что, хотя такое поведение не было запрограммировано, 
появление новых групп приводит к смещению расположенных рядом с ними, так 
что в итоге позиции групп оказываются равномерно распределены в пространстве. 
Политологи часто наблюдают подобное поведение в пространстве политических 
партий: когда появляются новые партии, существующие корректируют свои по- 
зиции. 

Но перейдем к файлу-заголовку. То, что я называю функциями присоединения 
и выхода, обычно принято называть функциями копирования и освобождения. 
В структуре дгоор $ есть поле $12е, в котором хранится количество членов груп- 
пы – счетчик ссылок. Я пользуюсь библиотеками Арорћепіа и СІ1Ь. Отметим, что 
группы хранятся в связанном списке, доступном только в файле &тоирэ.с; для рабо- 
ты с этим списком нужны всего две строки кода, содержащие обращения к 9 1151 
аррепа и 9 1151 геточе (пример 11.22). 


Пример 11.22 * Открытая часть объекта дгопр_з (дгоирѕ.ћ) 


#іпс1І0џае <арор.һ> 
#іпсіџоае <91іЫ.һ> 


фуредеЁ ѕігисі { 
951 уесбог *роѕібіоп; 
іпё іа, ѕіге; 

} гоор $; 


9гоир_5* дгоџр пем (951 уесбог *роѕібіоп); 

дгооцр 5* дгоџр јоіп (дгоор ѕ *јоіпте, 951 уесёог *роѕібіоп); 
уоіа дгоџр ехії (9гоир_$ *Іеауете, 951 уесіог *роѕібіоп); 
дгоџр_5* дгоцр с1оѕеѕі (951 месіог *роѕіёбіоп, ЯоџЫ1е тр); 
уоіа ргіпё дгоџрѕ(); 


Далее приведен файл, содержащий детали реализации объекта группы. 
Пример 11.23 + Объект дгоир ѕ (дгоирѕ.м) 
@ Это пролог: мы включаем заголовок и объявляем глобальный список групп, 


который будет использоваться в программе. Для каждой группы нам будут нужны 
функции пем/сору/ Ёгее. 


ёс 
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#1пс1ае "дгоцрѕ.ћ" 


61156 *дго0р 1151; 
@<пем дгоир@> 
@<сору дгоир@> 
@<Егее дгоир@> 


@ Метод группы пем стереотипный: мы выделяем память с помощью |та11ос|, 
заполняем структуру, пользуясь позиционными инициализаторами, и добавляем 
новую группу в список. 


@<пем дгоир@>= 
9гоир_з *дгоџр пем (951 уесбог *роз1&1оп) { 
$ аЕ1с іпё іа=0; 
дгоџр ѕ *о0це = та110ос (5ігеої (дгоџр 5ѕ)); 
хоц = (дгоџр 5) {.роѕіїіоп=арор чесёог сору (роѕіїіоп), .ід=іа++, 
.512е=1}; 
дгоџр 1156 = ӯ 1іѕі аррепа (агоџр 1іѕї, ои); 
гебигп ооё; 


@ Когда агент присоединяется к группе, группа 'копируется', но при этом 
перемещается не так уж много памяти: группа просто модифицируется для 
включения еще одного человека. Мы должны увеличить счетчик ссылок (это 
просто), а затем пересчитать среднюю позицию. Если средняя позиция без 
учета $п$ого человека равна $Р (п-1}$, а $п$ый человек занимает позицию 
$р$, то новая средняя позиция с учетом этого человека $Р п$ равна 
взвешенной сумме. 


$$Р п = \1еғе( (п-1)Р_{п-1}/п \гідће) + р/п.$$ 
Это выражение вычисляется для каждого измерения. 


@<сору дгопр@>= 
дгоор ѕ *дгоцр јоіп (гоџр ѕ *јоіпте, 951 уесіог *роз11оп) { 
іп п = ++)01пте->$12е; // увеличить счетчик ссылок 
Еог (іпё 1=0; 1< јоіпте->роѕібіоп->ѕіғе; 1++) { 
јоіпте->роѕіёіоп->ааба [1] *= (п-1.)/п; 
јоіпте->роѕісіоп->аӣаба [і] += роѕібіоп->ааќба [і] /п; 
} 


геёџгп јоіпте; 


@ Функция 'Ёгее' освобождает память, выделенную группе, только когда 
счетчик ссылок обращается в нуль. Если это не так, то нужно пересчитать 
среднюю позицию группы после выбытия из нее члена. 
@<ЁЕгее дгоир@>= 
уоіа дгоир_ех1* (дгоџр ѕ *1еауете, 951 уесіог *роѕібіоп) { 
іпе п = 1еауепе->$12е--; // уменьшить счетчик ссылок 
Ғог (116 1=0; 1< 1еауете->роѕіёіоп->ѕіғе; 1++) { 
1еауете->роѕіёіоп->ааѓёа [і] -= роѕісіоп->ааѓа [1] /п; 
1еауете->роѕіїіоп->ӣаѓба [і] *= п/ (п-1.); 
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1Е (1еауете->$12е == 0){ // убрать мусор? 
951 уесёог Ёгее (1еауете->роѕібіоп); 
дгооцр 1іѕі= д 1150 гетоуе (дгоир_113%, 1еауепе); 
Ғгее (1еауепе); 


@ Я экспериментировал с различными правилами вычисления расстояния между 
агентом и группой. И в конце концов остановился на норме $1 3$. Стандартное 
евклидово расстояние между точками $ (х 1, у_1)$ и $(х_2, у 2)$ называется 
нормой $1 2$ и вычисляется по формуле $\заг®{(х_1-х_2)^2+(у_1-у_2)^2}$. 

А норма $1 3$ вычисляется по формуле $\загЕ [3] { (х_1-х_2)^3+(у_1-у_2)^3}$. 
Этот вызов и вызов |арор_сору| выше - единственные обращения к функциям из 
библиотеки Арорпеп1а; если ее нет под рукой, то можно без труда написать 
эти функции самостоятельно. 


@<415Еапсе@>= 
арор_уеског_41$апсе (9->роѕіїіоп, ро51&10п, .тегіс='1', .погпт=3) 


@ Под 'ближайшей' я понимаю группу с максимальной выгодой, для которой 
величина "расстояние минус взвешенный размер" минимальна. Если дана функция 
полезности, представленная кривой |4іѕї|, то для нахождения минимального 
расстояния достаточно простого цикла |Ёог|. 


@с 
дгоџр ѕ *дгоир_с1о5е3* (951 чесіог *роѕіїіоп, доџр1іе таз$_Бепей*) { 
9гоир_$ * Ғауе=МОЦ; 
ӢоџЬ1е ѕта11еѕё аіѕё=651 РОЅІМЕ; 
Ғог (61156 *91=9го0р 1150; 91!= №01; 91 = 91->пехі) { 
дгоџр 5 *9 = 91->4ака; 
аоџр1є аіѕі= @<дізіапсеё> - таѕѕ Ббепеќё*9->ѕіге; 
1# (915 < ѕта11еѕё 4156) { 
ѕта11еѕ аіѕі = аіѕі; 
Ғауе = д; 


} 


гебогп Гауе; 


@ бпир1оЕ легко автоматизируется. Следующая функция анимирует результаты 
моделирования, для чего достаточно всего четырех строчек. Заголовок 

|р1оё '-'| просит систему построить график по следующим далее точкам. Затем 
выводятся координаты самих точек $ (Х, У)$, по одной на строке. Завершающий 
маркер |е| обозначает конец набора данных. Головная программа задает 
начальные настройки бпир1о%. 


@с 
уоіа ргіпё дгоирѕ () { 
ргіпёЁ ("ро '-' міёћ роіпіѕ роіпіёуре 6\п"); 
Ғог (СІіѕі *91=9го0р 1150; 91!= МОШ; 91 = 91->пехі) 
арор хуесіог ргіпё ( ( (9гоџр 5*) 91->ӣаѓа) ->ро$11оп); 
ргіпе# ("е\п"); 
} 
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Теперь, когда у нас есть объект группы вкупе с интерфейсными функциями для 
добавления групп, присоединения и выхода из группы, головная программа может 
сосредоточиться на процедуре моделирования: определить массив людей, а затем 
войти в цикл проверки членства и печати (пример 11.24). 


Пример 11.24 + Основанная на агентах модель, в которой используется объект 
9гоир_$ (дгоирабт.м) 


@* Инициализация. 


@ Это часть основанной на агентах модели, включающая обработчики структур 
|реор1е| и саму процедуру. 


Интерфейс с группами осуществляется с помощью функций пем /јоіп/ехіб/ргіпі из файла 
|9гопр$.смер.с|. Поэтому в этом файле нет никакого кода для управления 

памятью - механизм подсчета ссылок гарантирует, что вместе с выбытием из 

группы последнего члена освобождается память, занятая самой группой. 


@с 

#іпс1џде "дгаир$. В" 

іп рор=2000, 
регіоӣѕ=200, 
аітмепѕіоп=2; 


@ В функции |таіп| инициализируется несколько констант, которые не могут 
быть сделаны статическими переменными, потому что при вычислении их 
значений производятся математические вычисления. 


@<ѕе ир тоге сопзёапёѕ@>= 
аоџр1е пем дгоџр 044$ = 1./рор, 
таѕѕ репеѓіє = .7/рор; 
951 гпд *г = арор гп9 а11ос (1234); 


@* Структура |регѕоп 5]. 


@ Люди в этой модели довольно скучные: они не умирают и не двигаются. 
Поэтому в структуре они представлены только позицией |роѕібіоп| и группой, 
членом которой в данный момент является агент. 


ёс 

ёурейеЁ ѕігисі { 
951 уесіог *роѕіѓбіоп; 
дгоџр 5 *9гочр; 

} регѕоп з; 


@ Процедура инициализации тоже скучная, ей только требуется получить 
случайный вектор с равномерным распределением координат. 


ёс 
регѕоп ѕ регѕоп ѕеїир (951 гпд *г) { 
951 месіог *роѕп = 951 уесіог а11ос (аітепѕіоп); 
Рог (іп 1=0; 1< дітепѕіоп; 1++) 
951 месіог ѕеї (розп, 1, 2*951 гпд_ип1Еогм (г) -1); 
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геёцгп (регѕоп 5) {.роѕіёіоп=роѕп); 


} 
@* Членство в группе. 


@ В начале этой функции человек покидает свою группу. А дальше нужно принять 
решение: сформировать новую группу или присоединиться к существующей. 


ёс 
уоіа сһеск тетрегѕћір (регзоп_$ *р, 951 гпд *г, 
4оцЬ1е таѕѕ репейё, доџр1е пем дгоџр оаа) { 
дгоџр ехіє (р->9гоир, р->роѕіїіоп); 
р->9гоир = (951 гп9 ипіѓогт(г) < пем дгоџр ойаѕ) 
? @<Ғогт а пем дгоир@> 
: @<)о1п ће с1оѕеѕі дгоџрӣё>; 


} 


@ 
@<Ғогт а пем дгоир@>= 
дгопр_пем (р->роз11оп) 


@ 
@<јоіп ће с1оѕеѕі дгоџрё>= З 
дгоџр јоіп (дгоџр с1оѕеѕё (р->роѕіёіоп, таѕѕ Брепеѓіє), р->роѕібіоп) 


@* Подготовка. 
@ Инициализация популяции. Благодаря макросам СМЕВ код самодокументирован. 


ёс 

уоіа 1114 (регѕоп 5 *реор1е, іп рор, 951 гпд *г) { 
@<роѕібіоп еуегуродуё> 
@<5ЕагЕ міћһ {еп дгоир$з@> 
@<еуегуБо4ду јоіпѕ а дгоир@> 


} 


ё 
@<роз1Е1оп еуегуроауё@>= 
Ғог (іп 1=0; 1< рор; 1++) 
реор1е[1] = регѕоп ѕебир (г); 


(9 Первые десять людей в списке формируют новые группы, но поскольку позиция 
каждого случайна, то и положение десяти групп случайно. 


@<ѕбагі міёћ беп дгоир$@>= 
Ғог (іп 1=0; 1< 10; 1++) 
реор1е[1].дгоир = дгоџр пем (реор1е [і] .роѕібіоп); 


@ 
@<еуегуроау јоіпѕ а дгоир@>= 
Ғог (іпё 1=10; 1< рор; 1++) 
реор1е [і] .дгоџр = дгоџр јоіп (реор1е[1%10].дгоир, реор1е[1].роѕіїіоп); 


@* Построение графиков с помощью Спир1о%. 


@ Это заголовок Спир1оё. Я понял, как он должен выглядеть, после того 
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как поэкспериментировал с Спџор1ої в командной строке. Подходящие настройки 
я включил сюда. 


@<рг1пЕ һе Спир1оЕ Веадег@>= 
рг1пеЁ ("ипѕе Кеу;зее хгапде [-1:1] \пѕе угапде [-1:1]\п"); 


@ Анимация Спир1оЄ состоит из последовательносте команд р1о®. 


@<р1оє опе апітаёіоп Ёгатеё>= 
ргіпе дгоирѕ(); 


@* |таіпі. 


@ Функция |таіп| включает несколько подготовительных шагов и простой цикл: 
вычислить новое состояние и построить его график. 


ёс 

іп таіп () { 
@<ѕе ир тоге сопзёапіѕ@> 
регѕоп з реор1е [рор]; 
1116 (реор1е, рор, г); 


@<рг1пЕ ће Сбпир1ое пеадег@> 
Еог (106 6=0; < регіоаѕ; ++) { 
Ғог (116 1=0; 1< рор; 1++) 
сһеск тетрегѕћһір (&реор1е [і], г, таѕѕ репейі, пем дгоџр одаѕ); 
@<р1оЕ опе апітаёіоп Ёгаме@> 


Заключение 


В этом разделе было приведено несколько примеров базовой формы объекта: 
структуры, дополненной функциями пем/сору/Ётее. Я так расщедрился на при- 
меры, потому что несколько десятков лет развития и тысячи библиотек доказали, 
что это отличный способ организации кода. 

В тех частях главы, где не было примеров шаблона ѕігисё/пем/сору /ќтее, про- 
демонстрированы различные пути расширения существующих конструкций. 
В частности, показано, как расширить саму структуру посредством ее включения 
в обертывающую структуру в качестве анонимного члена. 

Что касается ассоциированных функций, то мы видели несколько способов до- 
биться того, чтобы одна функция выполняла различные действия в зависимости 
от переданной структуры. Если включить функции в состав структуры, то мы смо- 
жем написать функцию диспетчеризации, которая будет использовать структуру, 
являющуюся частью объекта. Благодаря у-таблицам функции диспетчеризации 
можно расширять даже после поставки структуры заказчику. Мы познакомились 
также с ключевым словом бепегіс, которое позволяет решить, какую функцию 
вызывать, в зависимости от типа управляющего выражения. 

Смогут ли все эти средства сделать вашу программу более понятной и улуч- 
шить интерфейс с пользовательским кодом, решать вам. Но вот для того чтобы 
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сделать более понятным чужой код, эти приемы определенно оказываются по- 
лезными. Возможно, вам поручено сопровождать библиотеку, написанную мно- 
го лет назад, и ваши потребности вовсе не совпадают с целями ее авторов. В этом 
случае методы, описанные в этой главе, придутся весьма кстати: вы сможете 


расширить существующие структуры и добавить новые возможности в сущест- 
вующие функции. 


пз 12 


ооофооофоооо ооо оо соо ооо эсво ох ооо ооо яоесокотве 


Параллельные потоки 


99 революций происходят сегодня. 


— Сгесп Рау 


Чуть ли не все компьютеры, проданные за последние несколько лет, – и даже мно- 

гие телефоны – содержат несколько процессорных ядер. Если вы читаете этот 

текст на компьютере с клавиатурой и монитором, то можете узнать, сколько в нем 
ядер: 

О Ппих: дгер согез /ргос/сриіпіо; 

О Мас: зузсЕ1 һи. Іодіса1сри; 

О Сурміп: епу | дгер МОМВЕК ОЕ РКОСЕЅ50В5. 

Однопоточная программа не полностью задействует ресурсы, которым одарил 
нас производитель оборудования. К счастью, не так уж сложно превратить ее в 
программу с параллельно выполняющимися потоками - более того, зачастую это 
требует всего одной дополнительной строки кода. В этой главе будут рассмотрены 
следующие вопросы: 

О краткий обзор нескольких стандартов и спецификаций, относящихся 

к написанию параллельного кода на С; 
добавление вызова одной функции из библиотеки ОрепМР который сдела- 
ет циклы ог многопоточными; 

О замечания о флагах компилятора, необходимых для компоновки програм- 

мы с библиотекой ОрепМР или ріһгеайѕ; 

О некоторые соображения о том, когда использование одной волшебной стро- 

ки безопасно; 

О реализация каркаса тар-гедисе, для чего, помимо вышеупомянутой строки, 

требуется еще кое-что; 

О синтаксическая конструкция для параллельного запуска нескольких раз- 
личных задач, например основной работы и ее графического интерфейса 
пользователя; 

О ключевое слово _Тһсеаа Іоса1, которое позволяет создавать поточно-локаль- 
ные копии глобальных статических переменных; 

О критические области и мьютексы; 

О атомарные переменные в ОрепМР; 

О замечание о последовательной непротиворечивости и о том, зачем она 
нужна; 
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О потоки, описанные в стандарте РОЅІХ, и их отличия от ОрепМР; 

О реализация атомарных скалярных переменных с помощью атомов С; 

О реализация атомарных структур с помощью атомов С. 

Это еще одна глава, в которой излагается материал, отсутствующий в стандарт- 
ных учебниках С. Обследуя рынок, я не нашел ни одной книги общего характера 
по С, в которой рассматривалась бы библиотека ОрепМР. Поэтому я расскажу до- 
статочно, чтобы вы могли приступить к работе, — быть может, даже настолько мно- 
го, что вам вообще не придется обращаться к книгам, специально посвященным 
теоретическим вопросам многопоточности. 

Однако есть книги на тему параллельного программирования, в том числе 
на С, в которых рассматриваются многочисленные детали, для которых мне не 
хватает места, например [Вгеѕћеагѕ 2009], [Соуе 2010], [Сгата 2003]. Я буду при- 
держиваться алгоритма планирования, подразумеваемого по умолчанию, и самой 
безопасной формы синхронизации, хотя в некоторых случаях можно было бы до- 
биться большего эффекта за счет более точной настройки этих вещей. Я не стану 
вдаваться в детали оптимизации кэша и не приведу полного перечня полезных 
прагм ОрепМР (его вы без труда сможете найти в Интенете). 


Окружение 


Механизм многопоточности вошел в стандарт С только в декабре 2011 года. Это 
произошло с явным запозданием, к этому моменту уже существовали решения от 
различных производителей. Итак, к нашим услугам несколько вариантов. 

О Потоки РОЅІХ. Стандарт р геа4$ был определен в РОЅІХ у1 в 1995 году. 
Функция рїћгеай сгеаїе сопоставляет каждому потоку функцию опреде- 
ленного вида, поэтому нам предстоит написать подходящий функциональ- 
ный интерфейс и обычно сопровождающую его структуру. 

О В\УЛп4о\з имеется собственная система потоков, работающая по аналогии 
с рћгеадѕ. Например, функция СгеаѓеТћгеаа принимает функцию и указа- 
тель на параметры - так же, как рћгеай сгеаќе. 

О ОрепМР - это спецификация, в которой используются многочисленные 
директивы #ргадта и ряд библиотечных функций, с помощью которых про- 
грамма сообщает компилятору, когда и как создавать поток. Именно та- 
ким способом можно превратить последовательный цикл ѓог в распарал- 
леленный, добавив всего одну строчку кода. Первая версия спецификации 
ОрепМР для С вышла в 1998 году. 

О Спецификация стандартной библиотеки С теперь включает заголовки, в ко- 
торых определены функции для многопоточной работы и операций с ато- 
марными переменными. 

Что из перечисленного использовать, зависит от целевого окружения, а также 
ваших собственных устремлений и предпочтений. Если ваша цель – обеспечить 
надежную компиляцию кода как можно большим числом компиляторов, то в на- 
стоящее время, как ни странно, оптимальным будет решение, дальше других вы- 
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ходящее за пределы стандартного С: ОрепМР. Оно поддерживается всеми основ- 
ными компиляторами, даже \У1зца| Зи 1о'. На момент написания этой книги мало 
найдется пользователей, у которых есть компиляторы и стандартные библиотеки, 
поддерживающие многопоточность, описанную в стандарте С. Если вы не любите 
полагаться на прагмы, то воспользуйтесь библиотекой р геа4 – она существует 
для любой РОЅІХ-совместимой платформы (даже МшС У”). 

Существуют и другие возможности, например МР! (интерфейс передачи сооб- 
щений, предназначенный для взаимодействия узлов сети) или ОрепСі (особенно 
полезно для обработки на графических процессорах). В РОЅІХ -совместимых си- 
стемах можно воспользоваться системным вызовом Ёогк, чтобы создать два экзем- 
пляра программы, которые разделяют общую память, но в остальном работают 
независимо. 


Составные части 


Наши синтаксические потребности скромны. Во всех случаях нам нужно сле- 
дующее. 

О Средства, позволяющие сообщить компилятору о необходимости запуска 
нескольких потоков сразу. В качестве раннего примера приведу примечание 
в строке 404 романа Набокова «Бледное пламя» [МабоКоу 1962]: [Тут время 
начало двоиться]. Далее повествование колеблется между двумя потоками. 

О Средства, позволяющие отметить точку, где дополнительные потоки пре- 
кращают существование, а главный поток продолжает работать в одиночест- 
ве. В некоторых примерах, в частности вышеупомянутом раннем примере, 
барьер неявно устанавливается в конце некоторого участка, тогда как в дру- 
гих существует явный шаг «ожидания потоков». 

О Средства, позволяющие сказать, что некоторый код не должен распаралле- 
ливаться, потому что его нельзя сделать потокобезопасным. Например, что 
произойдет, если один поток установит новый размер массива 20, а в то же 
время другой поток установит размер того же массива равным 30? Конеч- 
но, изменение размера занимает всего какую-нибудь микросекунду, но ссли 
бы мы могли замедлить время, то увидели бы, что даже простейшая опе- 
рация инкремента х++ распадается в последовательность конечных опера- 
ций, на которых возможен конфликт потоков. Прагмы ОрепМР позволяют 
пометить такие нераспараллеливаемые сегменты как критические области, 
а в системах на основе рЕгеа4 синхронизация обеспечивается мьютек- 
сами (слово тшех образовано в результате объединения двух слов тиѓиаї 
ехсіиѕіоп – взаимоисключение). 

О Средства для работы с переменными, к которым одновременно могут об- 
ращаться несколько потоков. Существуют различные стратегии, например 
превратить глобальную переменную в поточно-локальную или синхрони- 
зировать доступ к каждой такой переменной с помощью мьютекса. 


' Уіѕџа! Ѕсидіо поддерживает версию 2.0, а текущая версия ОрепМР имсет номер 4.0, по 
основные прагмы, рассматриваемые в этой книге, не новы. 
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ОрепмР 


Вкачестве примера распараллелим программу подсчета слов. Некоторыми служеб- 
ными функциями для работы со строками, позаимствованными из примера 11.21, 
я воспользуюсь в функции подсчета слов. Чтобы отделить ее от частей, относящих- 
ся к многопоточности, я помещу эту функцию в отдельный файл; см. пример 12.1. 


Пример 12.1 *% Функция подсчета слова считывает весь файл в память, а затем 
разбивает строку по символам, не являющимся частью слова (могасоиг\.с) 
#іпс1џде "ѕігіпд обі11біеѕ.һ" 


іп мс (сһаг *4оспаме) { 


сһаг *Чос = ѕігіпд Ёгот ћ1е (дӢоспапте); © 
1Е (!Чос) гевогп 0; 

сһаг *деітібегѕ = " `-!@#$%^&* () _-+={ [] }1\\;:\",<>./2\п"; 
ок_аггау *мог4$ = ок аггау_пем(4ос, е1ітібегѕ); ө 


1Е (!могаѕ) гевагп 0; 
ЧочЬ]е оцЕ= мога$->1епдЕВ; 
оК_аггау_Ёгее (могаѕ); 
гебигп оцё; 


} 


© Функция 5119 Ёгоп #1е, заимствованная из примера программы «изучения 
китов», считывает весь документ в строку в памяти. 

Ө Эта функция, заимствованная из библиотеки служебных функций для работы 
со строками, разбивает строку по заданным разделителям. Нам от нее нужен 
только счетчик. 


В примере 12.2 эта функция вызывается для каждого файла, указанного в ко- 
мандной строке. Функция па1п сводится к многократному вызову ис в цикле ѓог и 
последующему суммированию отдельных счетчиков для получения общего итога. 


Пример 12.2 * Добавив всего одну строку кода, мы можем выполнять различные 
итерации цикла Еог в разных потоках (орептр_мс.с) 


#1пс14е "зеор1 Е.В" 
#1пс1и4е "могасоопе.с" 


116 таіп(іпе агас, сһаг **агду) { 
атдс-=; 
агду++; о 
Ѕёорії (! агдс, геогп 0, "Необходимо указать хотя бы одно имя файла в " 
"командной строке."); 
106 соопё [агас]; 


#ргадта отр рага11е1 Ёог ө 
Ғог (іп 1=0; 1< агдс; 1++) { 
соцпе [1] = мс (агду(і]); 


ргіпеЁ ("%3:\6%1\п", агау[1], соопё([1]); 


} 


1Іоп9 іп ѕит=0; 
Еог (іп 1=0; 1< агдс; 1++) ѕит+=соопе [1]; 
рге1пЕЁ ("У : \Е%11\п", зим); 
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© агду [0] содержит имя программы, поэтому пропускаем его. Остальные элемен- 
ты массива агду — это аргументы, заданные в командной строке, то есть файлы, 
для которых нужно подсчитать слова. 

Ө В результате добавления этой строки цикл ог распараллеливается. 


Обратили внимание на строку, которая превращает эту программу в многопо- 
точную? Она содержит инструкцию ОрепМР: 


#ргадта отр рага11е1 Ёог 


означающую, что следующий сразу после нее цикл Еог следует разбить на участки 
и создать для их выполнения столько потоков, сколько компилятор сочтет опти- 
мальным. В данном случае я выполнил свое обещание превратить последователь- 
ную программу в параллельную добавлением всего одной строчки кода. 

ОрепМР определяет, сколько потоков может одновременно работать в системе, 
и соответственно разбивает работу на части. Если вы хотите задать количество 
потоков вручную, то нужно либо присвоить значение переменной окружения до 
запуска программы: 


ехрогЕ ОМР_МОМ_ТНВЕАО$=М 


либо обратиться к библиотечной функции в самой программе: 


#1пс1иае <отр.һ> 
отр_зеЕ пот Єһгеааѕ (№); 


Пожалуй, наиболее полезны эти средства, когда нужно задать число потоков 
равным 1. Чтобы вернуться в режим по умолчанию – запрашивать столько пото- 
ков, сколько имеется процессорных ядер, нужно поступить так: 


#іпс10џае <отр.һћ> 


отр ѕе пит ёћгеааѕ (отр де пот ргосѕ()); 


С № Макрос, определенный с помощью директивы #4ейпе, не может расширяться в #ргадпа, 

\. / ичто же делать, если хочется распараллелить макрос? Для этого в стандарт введен опера- 

= тор Ргадпа (С99 иС11 86.10.9). Его единственный операнд читается из строки (на жаргоне 
официального стандарта сеѕігіпдігеа) и интерпретируется как прагма. Например: 


#1пс1иае <5Еа1о.Н> 
#аейпе рЁог(...) _Ргадта (“отр рага11е1 Ёог”) Ёог( ҮА АКб5 _) 


іп маіп () { 

рЁог (іпе 1=0; 1< 1000; 1++) { 
ре1пЕЕ ("%1\п", 1); 

} 

} 


Компиляция для использования ОрепМР 


Для того чтобы рсс и сіапе (отметим, что поддержка ОрепМР в сІапе па некоторых 
платформах еще реализована не полностью) откомпилировали эту программу, нс- 
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обходимо задать флаг компилятора -Ёореппр. Если требуется отдельный шаг ком- 
поновки, то этот флаг нужно задать также для компоновщика (компилятор знает, 
нужно ли прикомпоновывать какие-нибудь библиотеки, и сам сделает все необхо- 
димое). Для использования библиотеки рёћгеаӣ требуется флаг -рйгеа4, так что 
если вам нужно то и другое, поместите такие строки в таКе#е: 


СЕТАС$=-4 -Ма11 -03 -Ғорептр -рЕВгеаа 
ІрІВЅ=-#орептр 


Если вы пользуетесь АиѓосопѓЁ, то добавьте в файл сопйдите. ас строку: 


АС _ОРЕММР 


Она порождает переменную $ОРЕММР СРІАб5, которую затем нужно будет доба- 
вить в состав флагов в файле Макеї1е.ат. Например: 


АМ СРЬАС$ = $ (ОРЕММР СЕІАС5) -9 -Ма11 -03 ... 
АМ_ГОРЬАС$ = $ (ОРЕММР_СРЬАС$) $ (ЅО1ІТЕ ІЮҒІАС5) $ (МУЗОГ_ГОЕЬАС$) 


Итого понадобилось три строчки кода, зато теперь Аиосоп{ будет правильно 
компилировать программу на любой известной ему платформе, которая поддер- 
живает ОрепМР, 

Стандарт ОрепМР требует, чтобы в случае, когда компилятор поддерживает 
прагмы ОрепМР, был определен символ _ОРЕММР. Поэтому для условной компиля- 
ции частей программы можно воспользоваться директивой #1Ё4еЁ ОРЕММР. 

Откомпилировав программу #һгеайей ис, попробуйте выполнить команду 
./Хћсеадеа юс ‘па ~ -уре Ё` для подсчета слов во всех файлах, находящихся в до- 
машнем каталоге. Можете запустить в другом окне команду ѓор и посмотреть, 
сколько работает экземпляров ис. 


Интерференция 


Итак, синтаксис для превращения программы в многопоточную у нас имеется, 
но есть ли гарантия, что такая программа будет работать правильно? В простых 
случаях, когда можно доказать, что все итерации цикла независимы, да. Но есть и 
другие ситуации, когда нужно проявлять осторожность. 

Чтобы доказать, что группа потоков работает правильно, мы должны знать, что 

происходит с каждой переменной и каковы побочные эффекты. 

О Если переменная не видна за пределами потока, то есть уверенность, что она 
ведет себя так же, как в однопоточной программе, и никакой интерферен- 
ции не возникает. В частности, итератор цикла, который в примере выше 
называется і, локален в каждом потоке (ОрепМР 4.0 $2.6). Переменные, 
объявленные внутри цикла, видны только в этом цикле. 

О Если переменная читается различными потоками, но ни один из них нигде 
не изменяет ее, то безопасность обеспечена. И чтобы понять это, не нужно 
знать высшую математику: при чтении переменной ее состояние не изменя- 
ется (я не говорю об атомарных флагах С, которые невозможно прочитать 
без установки). 
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О Если в переменную пишет один поток, а никакой другой не читает, то кон- 
куренции опять же нет, и можно считать, что переменная по существу по- 
точно-локальна. 

О Если переменную сообща используют несколько потоков, если она запи- 
сывается в одном потоке, а читается (или записывается) в другом, то воз- 
никают проблемы, и оставшаяся часть этой главы посвящена их решению. 

Отсюда первое следствие: по возможности избегать разделения переменных, 
в которые производится запись. Один из способов добиться этого показан в при- 
мере выше: все потоки пользуются массивом соџпї, но на і-й итерации изменяет- 
ся только і-й элемент массива, а это значит, что каждый элемент массива можно 
считать поточно-локальным. Кроме того, сам массив соопї не изменяется во время 
выполнения цикла – его размер остается постоянным, отведенная ему память не 
освобождается и т. п., — и то же самое относится к массиву агду. А ниже мы и вовсе 
избавимся от массива соџпі. 

Мы ничего не знаем о внутренних переменных рх1 п", но стандарт С требует, 
чтобы все функции стандартной библиотеки, работающие с потоками ввода-выво- 
да (то есть почти все объявленные в заголовке $1910.1), были потокобезопасными, 
поэтому мы можем вызывать ргіпії, не опасаясь интерференции различных вы- 
зовов (С11 $7.21.2(7) и (8)). 

При написании этого примера пришлось внимательно следить за соблюдением 
описанных условий. Однако некоторые рекомендации, в частности совет избегать 
глобальных переменных, в равной мере относятся и к однопоточным программам. 
Кроме того, начинает приносить плоды стиль объявления переменных в точке 
первого использования, распространившийся после принятия стандарта С99: ведь 
переменная, объявленная внутри участка, который будет подвергнут распаралле- 
ливанию, безусловно, должна быть поточно-локальной. 

Попутно отметим, что программа опр рага11е1 Ёог понимает только простые цик- 
лы: итератор должен иметь целый тип, увеличиваться или уменьшаться на каж- 
дой итерации на постоянную величину (инвариант цикла), и в условии окончания 
итератор должен сравниваться со значением инварианта цикла или с переменной. 
Все циклы, в которых одни и те же действия применяются к каждому элементу 
фиксированного массива, попадают в эту категорию. 


Мар-гедисе 


Программа подсчета слов имеет типичную структуру: каждый поток выполняет 
какую-то независимую задачу и порождает некоторый результат, но интерес пред- 
ставляет сведение этих частичных результатов в единственный агрегат. Ореп МР 
поддерживает такую последовательность операций распределения и редукции 
(тар-гедисе) за счет добавления к рассмотренной выше прагме. В примере 12.3 
массив соџп заменен одной переменной (оїа] ис, а в прагму ОрепМР добавлена 
часть гефисЕ1оп (+: Коба] мс). Начиная с этого момента, компилятор сам эффектив- 
но организует работу по объединению вычисленных каждым потоком частичных 
значений {0{а1 мс в одно итоговое значение. 
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Пример 12.3 + Чтобы реализовать в цикле Гог последовательность операций 
распределения и редукции, необходимо добавить фразу в прагму #ргадта опр 
рага11е1 Рог (таргедисе_мс.с) 


#іпс10џдӢе "5кор1Ё.В" 
#іпсіџдӢе "могасоцпё.с" 


іп таіп (іп агдс, сһаг **агду) { 
агдс--; 
агду++; 
ЅеоріЁ (! агдс, гебогп 0, "Необходимо указать хотя бы одно имя файла в " 
"командной строке."); 
1опд іпі боба1 мс = 0; 
#ргадта отр рага11е1 Ёог \ 
гейџсбіоп (+: вова] мс) © 
Ғог (116 1=0; 1< агас; 1++) { 
1019 іпі (115 соџпі = мс(агду[1]); 
Соба1 мс += Ёһіѕ соџ0пё; 
ргіпбё ("%5:\6%11\п", агду[і], Еһіѕ соџпё); 
} 
ргіпеЕ ("5 :\%1і\п", Коба] мс); 
} 


© Добавление фразы гейџсѓіоп в прагму отр рага11е1 Рог сообщает компилятору, 
что эта переменная должна содержать сумму значений, вычисленных всеми по- 
токами. 


Но и на этот раз имеются ограничения: на месте оператора + во фразе 
гедис {оп (+: чагіар1е) можно использовать только один из основных арифметиче- 
ских операторов (+, *, -), поразрядные операторы (&, |, ^) и логические операторы 
(&&, ||). В любом другом случае придется вернуться к чему-то наподобие массива 
соипё выше и самостоятельно запрограммировать процедуру редукции, выполняе- 
мую после завершения всех потоков (см. вычисление максимума в примере 12.5). 
Кроме того, не забудьте инициализировать редуцируемую переменную до начала 
работы группы потоков. 


Несколько задач 


До сих пор мы рассматривали применение одной и той же операции к каждому 
элементу массива. Но, возможно, имеются две совершенно разные операции, кото- 
рые не зависят друг от друга и могут работать параллельно. Например, в програм- 
мах с графическим интерфейсом пользователя (ГИП) интерфейс часто работает 
в одном потоке, а фоновая обработка – в другом, чтобы избежать зависания интер- 
фейса. В этой ситуации применяется прагма рага11е1 ѕесііоп: 
#ргадта отр рага11е1 ѕесбіопѕ 
{ 

#ргадта отр ѕессіоп 

{ 


// Все находящееся в этом блоке выполняется в одном потоке 
ОІ збагбіпд Ёп(); 
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} 

#ргадта отр зес®1оп 

{ 
// А все находящееся в этом блоке - в другом потоке 
Браскепа ѕёагёіпд Ёп(); 


В ОрепМР есть и другие возможности, которые я здесь подробно рассматри- 

вать не буду, но вам они могут понравиться. 

О итд: За&е іпѕігисііоп, шиаре даа (одиночный поток команд, множест- 
венный поток данных). В некоторых процессорах имеется возможность 
применять одну и ту же операцию к каждому элементу вектора. Это не то 
же самое, что несколько потоков, исполняемых несколькими ядрами, и не 
все процессоры такой режим поддерживают. См. #ргадпа отр 5114, а также 
руководство по компилятору, потому что некоторые компиляторы автома- 
тически вставляют $ МО-команды там, где это возможно. 

О Если количество задач заранее неизвестно, то можно воспользоваться праг- 
мой #ргадта опр {азк, которая запускает новый поток. Например, для обхода 
дерева можно завести один поток, а в каждом листовом узле запускать с по- 
мощью этой прагмы новый поток для его обработки. 

О Можно создать несколько потоков для поиска чего-то. Но кактолько один по- 
ток обнаружит искомое, работа остальных потоков становится бессмыслен- 
ной. Тогда, чтобы отменить менее удачливые потоки, можно воспользоваться 
прагмой #ргадта опр сапсе! (в р(ћгеаа имеется эквивалент: ріћгеай сапсе]). 

Хочу, однако, предостеречь читателей от употребления #ргадта перед каждым 

циклом ог в программе: с созданием потоков сопряжены накладные расходы. Та- 
КОЙ КОД: 
116 х = 0; 
#ргадта отр рага11е1 Ёог гейџсќіоп (+:х) 
Ғог (іп 1=0; 1< 10; 1++) { 
х++; 


} 


затратит больше времени на порождение потоков, чем на инкрементирование х, 
и последовательная версия почти наверняка будет работать быстрее параллель- 
ной. Не скупитесь на вкрапления многопоточности, но всякий раз проверяйте, 
действительно ли производительность повысилась в результате изменений. 

Из того, что на создание и уничтожение потоков тратится дополнительное вре- 
мя, вытекает эвристическое правило: чем меньше потоков создается, тем лучше. 
Например, если имеется два вложенных цикла, то обычно эффективнее распарал- 
лелить внешний цикл, чем внутренний. 

Если вы уверены, что ни в одном из распараллеленных участков не произво- 
дится запись в разделяемую переменную и если все вызываемые функции потоко- 
безопасны, то можете дальше не читать. Расставьте в подходящих местах прагмы 
Ёргадта отр рага11е1 Рог или рага11е1 ѕесііопѕ и радуйтесь тому, насколько быстрее 
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стала работать программа. А оставшаяся часть этой главы, да и большинство ра- 
бот по многопоточному программированию посвящены стратегиям модификации 
разделяемых ресурсов. 


Поточная локальность 


Статические переменные – даже объявленные внутри участка #ргадта опр рага11е1 = 
по умолчанию разделяются всеми потоками. Чтобы создать отдельную копию 
переменной в каждом потоке, нужно добавить в эту прагму фразу Ећһгеайргітаќе, 
например: 

зЕаЕ1с іп зѕіаѓе; 


#ргадта отр рага11е1 Ёог ёһгеаайргіхаёе (5+ а*е) 
Рог (118 1=0; 1< 100; 1++) 


При соблюдении некоторых оговорок, продиктованных здравым смыслом, си- 
стема сохраняет набор поточно-локальных переменных, так что если переменная 
ѕёабіс х была равна 2.7 в потоке 4 в конце одного распараллеленного участка, то 
в потоке 4 она будет равна 2.7 и в начале следующего участка, распараллеленного 
между четырьмя потоками (ОрепМР $2.14.2). В любой момент существует один 
главный поток; вне распараллеленного участка главный поток сохраняет свою ко- 
пию статической переменной. 

Ключевое слово С Тһгеай 1оса1 «расщепляет» статические переменные анало- 
гичным образом. В С для поточно-локальной статической переменной «временем 
жизни является все время выполнения потока, в котором она создана, а ее значе- 
ние инициализируется в момент запуска потока» (С11 56.2.4(4)). Если считать, 
что поток 4 в одном распараллеленном участке – то же самое, что поток 4 в другом 
распараллеленном участке, то это поведение ничем не отличается от специфици- 
рованного в ОрепМР) если считать их разными потоками, то стандарт С следует 
интерпретировать так, что поточно-локальная память заново инициализируется 
в каждом распараллеленном участке. 

По-прежнему существует главный поток, который продолжает работать вне 
любого распараллеленного участка (явно это не оговорено, но вытекает из С11 
$5.1.2.4(1)), поэтому поточно-локальная статическая переменная в главном пото- 
ке очень похожа на традиционную статическую переменную, время жизни кото- 
рой совпадает со временем работы программы. 

В ССС ив сапё имеется ключевое слово _ {Вгеа4, которое было принято в ка- 
честве расширения ССС еще до добавления в стандарт ключевого слова Тћгеай 
1оса1. Внутри функции допустима любая форма: 
зкак1с _ Еһгеаа іп і; // специфика ССС/сЇапв; работает сегодня 

или 
те _Тһгеай Іоса1 іпё і; // С11, когда компилятор начнет поддерживать 


Вне функции ключевое слово ${а\1с необязательно, так как подразумевается по 
умолчанию. Стандарт требует, чтобы в заголовке ћгеайѕ.ћ был определен символ 


300 *% Часть 1. Язык 


Пгеа@_10оса], являющийся псевдонимом Тһгеаа 1оса1, точно так же, как в заголов- 
ке 596001 .| должен быть определен псевдоним 0001 для Воо]. 

Проверить, что именно использовать, можно с помощью последовательности 
директив препроцессора, в которой устанавливается подходящее значение симво- 
ла ћгеаа1оса1. Пример такой последовательности приведен ниже: 

{фопаеЕ Єһгеаа1оса1 
#1Е  5ТОС УЕКЅІОМ > 2011001 


#деіпе Сһгеааїосаї Тһгеаа 1оса1 
#е11Е дебпеа (__АРРЬЕ ) 


#аеїіпе Сһгеаа1оса1 //на момент написания этой книги не реализовано 

#е11Е (Чейпеа(__СМОС__) || аейпеа (__с1апд__)) && !дебпеа (&пгеа@1оса1) 
#Аейпе КргеаЯ1оса1 __(һгеаа 

#е15е 
#АеНпе Сһгеаа1оса1 

#епа1Е 


Локализация нестатических переменных 


Если переменная расщепляется на поточно-локальные копии, то нужно решить, 
как она будет инициализироваться в каждом потоке и что делать при выходе из 
распараллеленного участка. Фраза іћгеайргіхаѓе () говорит ОрепМР что статиче- 
скую переменную нужно инициализировать начальным значением переменной 
и сохранять копии при выходе из распараллеленного участка для использования 
при следующем входе в него. 

Мы уже видели подобную фразу: гейџсііоп (+:\аг) требует от ОрепМР инициа- 
лизировать копию переменной в каждом потоке нулем (или единицей в случае 
умножения), дать каждому потоку возможность самостоятельно производить 
сложения и вычитания, а после выхода прибавить значение поточно-локальной 
копии к исходному значению уаг. 

Нестатические переменные, объявленные вне распараллеленного участка, явля- 
ются по умолчанию разделяемыми. Чтобы создать локальные копии переменной 
]оса]уаг в каждом потоке, добавьте фразу ЙгзЕрг1уате (1оса]уаг) в строку #ргадта опр 
рага11е1. Копия создается в каждом потоке и инициализируется значением пере- 
менной в момент запуска потока. По завершении потока все копии уничтожаются, 
аисходная переменная не изменяется. Добавьте фразу 1азЁрг1уа{е (1оса1уаг), чтобы 
скопировать окончательное значение переменной в последнем потоке (том, у ко- 
торого наибольший индекс в цикле ог, или последнем в списке участков ѕесііоп) 
в переменную, находящуюся вне распараллеленного участка. Довольно часто 
можно увидеть одну и ту же переменную в обеих фразах Ёігѕіргітаѓе и Іаѕіргічаѓе. 


Разлеляемые ресурсы 


До сих пор я подчеркивал. важность использования поточно-локальных пере- 
менных и описывал средства расщепления одной статической переменной на не- 
сколько поточно-локальных. Но бывает так, что ресурс обязан быть разделяемым, 
и тогда простейшим средством его защиты является критическая область. Так на- 
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зывается участок программы, который в каждый момент времени может выпол- 
няться только одним потоком. Как и большинство прагм ОрепМР, эта воздейству- 
ет на блок, расположенный сразу за ней: 

#ргадта отр сгібіса1 (а ргіуабе Ь1оск) 

{ 


//здесь находится интересующий нас код 


} 


Гарантируется, что в этом блоке может находиться не более одного потока. Если 
некий поток подойдет к этому месту, когда в критической области находится дру- 
гой поток, то он будет ждать перед входом в область, пока исполняющийся в дан- 
ный момент поток не покинет ее. 

Это называется блокировкой; блокированный поток в течение некоторого вре- 
мени ничего не делает. Конечно, это неэффективно, но неэффективная программа 
все же гораздо лучше некорректной. 

Имя (а_рг1уаке Б1оск) в скобках позволяет связать критические области между 
собой, например чтобы защитить один и тот же ресурс, используемый в разных 
местах программы. Если вы не хотите, чтобы некая структура читалась в тот мо- 
мент, когда другой поток производит запись в нее, то можете воспользоваться этой 
возможностью: 

#ргадта отр сгіїіса1 (4е11саке_зЕгисе_гед1оп) 
{ 


де1ісабе зігисі џраӣаєе (43); 


} 
[какой-то код] 


#ргадта отр сг1&1са1 (дӢе1ісаїе зігисі гедіоп) 
{ 


де1ісабе ѕігисі геаа (45); 


} 


Гарантируется, что в объединенной критической области, состоящей из двух 
участков, в каждый момент времени находится не более одного потока, и потому 
обращение к 4е11са{е ѕїгисї ирдаее никогда не будет произведено одновременно 
с обращением к де]ісаѓе ѕїгисі геаа. Код между этими участками будет работать, 
как обычно. 


/ 


Строго говоря, имя необязательно, но все неименованные критические области считают- 
А ся частями одной и той же группы. Это типично для небольших программ-примеров (в том 
числе и тех, что можно найти в Интернете), но в нетривиальном коде может оказаться не- 
достаточно. Присваивая каждой критической области имя, мы предотвращаем непредна- 
меренное связывание двух участков. 


Рассмотрим задачу о нахождении количества делителей числа (простых и со- 
ставных). Например, число 18 нацело делится на шесть положительных целых чи- 
сел: 1, 2, 3, 6, 9, 18. У числа 13 всего два делителя, 1 и 13, то есть это число простое. 

Найти простые числа нетрудно – в диапазоне от 1 до десяти миллионов тако- 
вых 664 579. Но существует всего 446 чисел, меньших десяти миллионов, у кото- 


302 < Часть 1. Язык 


рых ровно три делителя, шесть – имеющих ровно семь делителей и только одно 
с 17 делителями. Числа с другим количеством делителей более распространены; 
так, существует 2 228 418, меньших десяти миллионов, у которых ровно восемь 
делителей. 

В примере 12.4 приведена программа для нахождения количества делителей, 
распараллеленная средствами ОрепМР В ней используются два массива. Первый, 
Ғасёог сё, содержит десять миллионов элементов. Все элементы, кроме первого, 
инициализируются значением 2, потому что любое число делится на едипицу и 
на себя. Затем мы прибавляем 1 к каждому элементу массива, индекс которого 
делится на два (то есть для каждого четного числа). Затем прибавляем 1 к элемен- 
там массива с индексом, кратным трем, и т. д. до пяти миллионов (в одной группе 
с пятимиллионным элементом оказался бы только десятимиллионный, если бы 
таковой был в массиве). По завершении этой процедуры мы будем знать, сколько 
делителей у каждого числа. При желании можете добавить цикл Ёог для вывода 
всего массива в файл с помощью Ёрг1 п. 

Далее создается еще один массив, в котором регистрируется, сколько чисел 
имеют 1, 2, ... делителей. Но перед этим мы должны найти максимальное коли- 
чество делителей, чтобы знать размер массива, а уже затем можно просматривать 
массив ЃЁасіог сї и заниматься подсчетами. 

Каждый шаг является очевидным кандидатом на распараллеливание с по- 
мощью прагмы #ргадта опр рага11е1 Ёог, но при этом могут возникнуть конфликты. 
Не исключено, что поток, помечающий кратные 5, и поток, помечающий кратные 
7, одновременно захотят увеличить элемент ѓасіог сї [35]. Чтобы предотвратить 
конфликт при записи, сделаем критической областью строку, в которой количест- 
во делителей элемента 1 увеличивается на единицу: 


#ргадта отр сг1{1са]1 (Ғасёог) 
Ғасёог сё [1]++; 


( Действие этих прагм распространяется на блок, следующий прямо за ними. Блоки обычно 
обозначаются фигурными скобками, но если фигурных скобок нет, то одиночная строка 
считается отдельным блоком. 


Когда один поток захочет увеличить элемент Ёасіог сї [30], он заблокирует дру- 
гой поток, желающий увеличить Ёасіог сї [33]. Критические области – это блоки 
кода, они имеют смысл, если разные блоки ассоциированы с одним и тем же ресур- 
сом. Но в данном случае мы пытаемся защитить десять миллионов ресурсов, и это 
подводит нас к идее мьютексов и атомарных переменных. 

Мъютекс (сокращение от тиѓиа! ехсіиѕіоп) применяется, чтобы заблокировать 
поток, и в этом он похож на критические области, состоящие из нескольких участ- 
ков. Однако мьютекс – это обычная структура, и никто не мешает завести десять 
миллионов мьютексов. Если захватить і до записи в элемент і и освободить его 
после записи, то мы получим критическую область, защищающую только элемент 
і. В программе это выглядело бы так: 
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отр 1Іоск ё 1оск$ [1е7]; 
Ғог (1опд іп 1=0; 1< 1оск сё; і++) 
отр ілпіє 1оск(610скѕ[1]); 


#ргадта отр рага11е1 Ёог 

Ғог (1оп9 іп зса1е=2; зса1е*1 < тах; зса1е++) { 
отр ѕеб Іоск (&1оск$ [5са1е*1]); 
Ғасбог сё [5са1е*1]++; 
отр опѕе _1оск (&10оскѕ[ѕса1е*і]); 


} 


Функция опр_зе{_]оск на самом деле относится ктипу «ждать, затем установить»: 
если мьютекс никем не захвачен, то она захватывает его и возвращает управление; 
если же мьютекс уже захвачен, то она блокирует поток и ждет, пока другой поток не 
выполнит функцию опр ипзе{_1оск, сообщив тем самым, что путь свободен. 

Мы, как и хотели, сгенерировали десять миллионов критических областей. 
Есть, правда, мелкая проблема – структура мьютекса сама занимает место, и для 
выделения десяти миллионов таких структур может уйти больше времени, чем 
на сами вычисления, совсем простые. Поэтому я решил использовать только 
128 мьютексов и захватывать мьютекс с индексом 1% 128. Тогда вероятность того, 
что два потока, работающие с разными числами, без необходимости заблокируют 
друг друга, составляет 1 к 128. Это не так страшно, зато на моих тестовых машинах 
скорость работы программы резко возросла за счет уменьшения накладных рас- 
ходов на создание и использование десяти миллионов мьютексов. 

Прагмы встроены в компилятор, который их понимает, но мьютексы – обычные 
структуры и функции, написанные на С, поэтому в программу нужно включить 
директиву #іпсіџде <отр.һ>. Исходный код приведен в примере 12.4, а часть, отно- 
сящаяся к поиску наибольшего числа делителей, вынесена в отдельный листинг. 


Пример 12.4 % Сгенерировать массив для хранения числа делителей, найти 
в этом массиве наибольший элемент и подсчитать, сколько есть чисел с 1, 2, ... 
делителями (орептр_{ас{ог$.с) 

#1пс1и4е <отр.һ> 

#1пс1и4е <з&41о.1> 

Н1пс1и4е <3&9116.в> //та110ос 

#1пс1и4е <5%г1па.В> //тетѕеб 


#1пс1и4е "орептр дестах.с" © 


116 таіп() { 
1опд іп тах = 1е7; 
116 *Ёасбог се = та11ос (ѕіг2еоЁ (іп) *тах); 


116 1Іоск сё = 128; 

отр Іоск Є 10скѕ[10ск сі]; 

Ғог (1оп9 іпё 1=0; 1< 1оск сё; 1++) 
отр іпіє 1оск (&10скѕ[1]); 


Ғасбог сё[0] = 0; 
Ғасбог сё [1] 1; 


304 < Часть. Язык 


Ғог (1опд іп 1=2; 1< тах; 1++) 
Ғасіог се [1] = 2; 


#ргадта отр рага11е1 Ёог 
Ғог (1оп9 118 1=2; 1<= тах/2; 1++) 
Еог (1оп9 116 зса1е=2; зса1е*1 < тах; зса1е++) { 


отр зе Іоск (&1оск$ [5са1е*1% 1оск сё]); © 
Ғасбог сё [зса1е*1]++; 
отр ипѕес 1оск (&1оск$ [$са1е*1% 1оск сё]); ө 


іпё тах Ёасіогѕ = де тах (Ёасіог сі, тах); 
1оп9 іле ба11у(тах Ёасіогѕ+1]; 
петзе{ (Са11у, 0, ѕігеоЁ (1опд іпё) * (пах Ёасбогѕ+1)); 


#ргадта отр рага11е1 Ёог 
Ғог (1опд іпё 1=0; 1< тах; і++) { 
116 Ёасіёогѕ = Ғасіог се [і]; 
отр ѕе 1оск (&10оскѕ[Ғасёогз% 10ск сЕ]); © 
ба11у[Ғасёогѕ] ++; 
отр опѕе Іоск (&1оск$ [Ғасёогѕ% 1оск сі]); 


} 


Ғог (іп 1=0; і<=тах Ғасёогѕ; 1++) 
ргіпеё ("%і\Е%11\п", і, ба11у[і]); 
} 


© См. следующий листинг. 

Ө Инициализировать. Числа 0 и 1 считаем составными. 

© Захватить мьютекс перед чтением или записью переменной. 

© Освободить мьютекс после чтения или записи переменной. 

© Я повторно использую имеющийся набор мьютексов, чтобы не проводить ини- 
циализацию еще раз, но здесь те же мьютексы применяются совсем для другой 
цели. 


В примере 12.5 мы ищем максимальное значение в массиве ѓасїог сї. Посколь- 
ку ОрепМР не предоставляет редуктора пах, придется завести массив, в котором 
каждый поток будет хранить свой локальный максимум, а затем найти в нем гло- 
бальный максимум. Длина этого массива равна опр де тах ёһгеайѕ (), анайти свой 
индекс каждый поток может с помощью функции отр деї їћгеай пит (). 


Пример 12.5 < Распараллеленный поиск максимального элемента в массиве 
(орептр_де{тах.с) 


іпЕ де тах (1пЕ *аггау, 1опд 11 мах) { 
іпЕ Еһгеаа сё = отр де тах ёһгеайѕ (); 
іпе пахез [(һгеаа сё]; 
петзе{ (тахеѕ, 0, ѕігеоЁ (ілі) *Сһгеаа сі); 


#ргадта отр рага11е1 Ёог 
Ғог (1оп9 іп 1=0; 1< тах; 1++) { 
іп 611$ Єһгеаа = отр де Єһгеаа пот(); 


Глава 12. Параллельные потоки % 305 


1Е (аггау[і] > тахеѕ[һіѕ Єһгеаа]) 
тахеѕ[Еһіѕ ёһгеаа] = аггау [і]; 


} 


іпЕ 91офа1 тах=0; 
Еог (іп 1=0; 1< ёһгеаа се; 1++) 
1Е (тахез[1] > 91оБа1 тах) 
д1ора1 тах = пахез [1]; 
гебсогп д1ора1 тах; 


В приведенных выше примерах каждый мьютекс защищает один участок кода, 
но, как и в случае критических областей, можно было бы с помощью единствен- 
ного мьютекса защитить ресурс, используемый в нескольких местах программы. 
отр ѕеб 1оск (&4е11саке_1оск); 


де1ісасе зігисі _ирдаее (5); 
отр ипѕеє 1Іоск (&4е11саке_1оск); 


[какой-то код] 


отр ѕеб 1оск (&4е11саке_1оск); 
деІісабе ѕегосі геаа (45); 
отр ипѕе Іоск (&де1ісабе 1оск); 


Атомы 


Атом – это мельчайший неделимый элемент!. Атомарные операции часто требу- 
ют специальных возможностей процессора, и в ОрепМР они ограничены только 
скалярами: почти всегда это целое число или число с плавающей точкой, реже ука- 
затель (то есть адрес в памяти). С предоставляет атомарные структуры, но даже 
в этом случае обычно нужен мьютекс для их защиты. 

Однако случай простых операций со скаляром самый распространенный, и 
в этой ситуации можно отказаться от мьютексов, заменив их атомарными опера- 
циями, которые по существу захватывают неявный мьютекс при каждом исполь- 
зовании переменной. 

Чтобы сообщить Ореп МР что вы хотите сделать с атомом, понадобится прагма: 


#ргадта отр асотіс геаа 
оце = аѓіоп; 


#ргадта отр аботіс мгібе ѕед сзі 
асот = оці; 


#ргадта отр асотіс ордаѓе ѕед схі 
аот ++; //или аѓот-- 


#ргадта отр аком1с џорааѓе 
// или любая бинарная операция: аіот *= х, аіот /=х, ... 


' Кстати, в стандарте С говорится, что у атомов С бесконечный период полураспада: «ато- 
марные переменные не подвержены распаду» [С11 7.17.3(13), сноска]. 
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асот -= х; 


#ргадта отр аёотіс сарёџге ѕед сѕЕ 
// обновить-затем-прочитать 
оиЕ = асот *= 2; 


Фраза ед с необязательна, но рекомендуется (если компилятор ее поддержи- 
вает); я вернусь к ней чуть ниже. 

Увидев прагму, компилятор должен сгенерировать команды, необходимые для 
того, чтобы на чтение атома в одной части кода не оказывала влияние запись в тот 
же атом в другой части. 

В программе подсчета делителей все ресурсы, защищенные мьютексами, - ска- 
ляры, а значит, мьютексы нам в общем-то и не нужны. Использование атомов де- 
лает программу короче и понятнее (пример 12.6). 


Пример 12.6 * Распараллеленный поиск максимального элемента в массиве 
(орептр_де{тах.с) 

#іпс10џае <отр.В> 

#іпс10џае <56аіо.һ> 

#іпсіџӣе <ѕёгіпд.һ> //тетѕеб 


#ілпс10де "орептр детах.с" 


іпё маіп() { 
1Іоп9 іпё тах = 1е7; 
116 *Ғасёог сі = па110с(ѕігеоЁ (іпё) *тах); 


Ғасбог сё [0] = 

Ғассог се [1] = 1; 

Еог (1опд іп 1=2; 1< тах; і++) 
Ғасіог сё [1] = 2; 


| 


#”ргадта отр рага11е1 ог 
Рог (1опд іп 1=2; 1<= тах/2; 1++) 
Ғог (1019 118 ѕса1е=2; $са1е*1 < тах; зса1е++) { 
#ргадта отр аёотіс ирдаее 
Ғасіог сё [ѕса1е*1] ++; 


} 


іп пах_Гасбог$ = дее_мах_ЁГасбог$ (Ғасіог сі, тах); 
1019 іпе ба11у[(тах Ғасіогѕ+1]; 
петзее (ба11у, 0, ѕігеої (10опд ілі) * (тах Ёасіогѕ+1)); 


#ргадта отр рага11е1 Ёог 

Ғог (1опд іп 1=0; 1< тах; 1++) { 
#ргадта отр аёотіс џирдаќе 
Са11у[Ғасіог сё [1]]++; 

} 


Ғог (іп 1=0; і<=тах Ёасіогѕ; 1++) 
ргіпеё ("%1\6%11і\п", 1, ба11у[1]); 
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Последовательная непротиворечивость 


Хороший компилятор переупорядочивает последовательность операций, стремясь по- 
лучить математически эквивалентную написанной вами, но работающую быстрее. Если 
переменная инициализируется в десятой строке, а впервые используется в двадцатой, 
то, возможно, будет быстрее совместить инициализацию и использование в двадцатой 
строке, чем выполнять два отдельных шага. Вот пример кода с двумя потоками, взятый 
из стандарта С11 $7.17.3(15) и сведенный к более понятному псевдокоду: 


х=у= 0; 
// Поток 1: 
г1 = 1оа4(у); 


зв оге (х, г1); 


// Поток 2: 
г2 = 1оаа(х); 
ѕЕоге (у, 42); 


Когда мы читаем этот код на странице книги, кажется, что г2 не может принять значение 
42, потомучто 42 сохраняется в переменной у в строке, следующей за той, где произво- 
дится присваивание г2. Если все команды из потока 1 исполняются до команд из потока 
2, между двумя командами потока 2 или после последней команды, то г2 действительно 
не может стать равным 42. Но компилятор мог бы переставить местами две команды 
из потока 2, потому что в первой используются только переменные г2 и х, а во второй – 
только переменная у, и, значит, между ними нет зависимости, требующей, чтобы одна 
выполнялась раньше другой. Таким образом, допустима и такая последовательность: 


х=у=0; 

ѕбоге (у, 42); //поток2 
г1 = 1оа4а(у); // поток 1 
ѕіоге (х, г1); // поток 1 
г2 = 1оаа(х); // поток 2 


Теперь все четыре переменные - у, х, 11 и г2 - равны 42. 

В стандарте С описаны и еще более извращенные случаи, один из них даже снабжен 
комментарием «такое поведение нельзя назвать полезным, и реализация должна из- 
бегать его». 

Вот к подобным ситуациям и относится фраза 5е4_сз{: она сообщает компилятору, что 
атомарные операции в данном потоке должны производиться именно в том порядке, 
в котором написаны. Она была добавлена в спецификацию ОрепМР 4.0, чтобы можно 
было воспользоваться преимуществами последовательно непротиворечивых атомов 
С, и ваш компилятор, возможно, еще не поддерживает ее. А пока рекомендуется вни- 
мательно следить за тонкими ошибками, которые могут возникнуть, если компилятор 
изменит порядок независимых строк, исполняемых в одном потоке. 


Библиотека рйгеад 


А теперь перепишем приведенный выше пример с использованием р гез4. Эле- 
менты похожи: средства порождения и ожидания потоков и мьютексы. В р геа4 
атомарных переменных нет, но они есть в самом С; см. ниже. 

Существенная разница заключается в том, что функция ріћгеаа сгеаїе, создаю- 
щая новый поток, принимает (помимо прочих аргументов) функцию типа 014 
*Еп(хоіа *1п) , а поскольку этафункция принимает единственный указатель на уо14, 
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то приходится писать специфичную для данной функции структуру для передачи 
ей данных. Функция также возвращает указатель, хотя если мы все равно опре- 
деляем специальный тип, то обычно проще включить в него выходные элементы 
наряду с входными, а не создавать специальную структуру для возврата данных. 
Прежде чем приводить код целиком, я хотел бы отдельно рассмотреть несколь- 
коважнейших участков (это означает, что часть переменных в кодене определена): 
{а11у_$ ЕПгеаа_1пЕо [&һгеаа сё]; 
Ғог (іпё 1=0; 1< Єһгеаа сё; 1++) { 
Єһгеаа ілѓёо[і] = ({а11у_$) {.Еһіѕ Єһгеаа=і, .ЕпгеаЯ с&=ЕВгеаа_с\, 
.ба11у=ёа11у, .тах=тах, .Ёасіог сі=Ғасбог сі, 
.пибехеѕ=тиёехеѕ, .тибех сі =тибех сі); 
реһгеаа сгеаѓе (&+һгеааѕ [і], №011, ада ба11у, &ЕПгеаа 1по[1]); 
} 
Еог (іпё 6=0; Е< Епгеа4_сЕ; &++) 
реһгеаа јоіп (Епгеааз [+], МОБ); 


В первом цикле Гог создается фиксированное количество потоков (довольно 
трудно динамически получить от р фгеаЯ число потоков, подходящее в конк- 
ретной ситуации). Сначала инициализируется структура, а затем мы вызываем 
рЕПгеа@ сгеаќе таким образом, чтобы в потоке исполнялась функция айа {а!1у, 
которой передается специально подготовленная структура. В конце цикла будут 
работать {ћгеай сё потоков. 

Следующий цикл юг – этап сбора результатов. Функция ріћсеаа јоіп блокиру- 
ет выполнение до тех пор, пока указанный поток не завершит работу. Таким об- 
разом, мы окажемся в точке, следующей за циклом Гог, не раньше, чем все потоки 
завершатся, и в этот момент останется только один главный поток. 

Библиотека рёргеа4 предоставляет мьютексы, которые ведут себя почти так 
же, как мьютексы ОрепМР. В простых примерах ниже для перехода на мьютексы 
рһгеай достаточно изменить имена типов. 

Ниже приведена программа подсчета делителей, переписанная с использова- 
нием библиотеки р геа4. Помещение каждой подпрограммы в отдельный поток, 
определение передаваемых функциям структур и процедуры создания и ожидания 
завершения потоков требуют довольно много кода (при том, что я по-прежнему 
пользуюсь написанной для ОрепМР функцией де пах). 


Пример 12.7 * Программа подсчета делителей, переписанная с использованием 
библиотеки ріһгеаа (р!ЙгеаЧ_ас{ог$.с) 


#іпсіџде <отр.һ> //деє тах по-прежнему пользуется ОрепмР 
#іпс1џде <ріһгеаа.һ> 

#іпс10џае <ѕЕаіо.һ> 

#іпсіџаӣе <3&4116.1> //ма11ос 

#іпс1џдӢе <ѕёгіпд.һ //мелзеё 


#іпсіџде "орептр детах.с" 
бурейе? ѕЕгисё { 


Іоп9 іп *ёа11у; 
іпЕ *Ёасёог сі; 


к? 
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11 тах, ЕПгеаа_сЕ, ёһіѕ ёһгеаа, тобех сі; 
реһгеаа тоѓех ё *тикехез; 
} са11у 5; 


уоіа *ааа Га11у (уоіа *уіп) { 
Са11у ѕ *іп = уіп; © 
Ғог (1опд 116 1=11->611$_&пгеаа; 1 < іп->тах; і += іп->Еһгеаа сі) { 
116 Ёасіогѕ = іп->Ғасбог сё [і]; 
реһгеаа поёех 1оск (&іп->тиёехеѕ [ Ёасіогѕ% іп->тобех сё]); © 
1п->6а11у [Еасфог$] ++; 
реһгеаа тиеех_ип1оск (&іп->тоёехеѕ [ Ёасёогѕ% іп->тиѓех сё]); 
} 
геіогп МОБ; 
} 


бурейеЁ $егис® { 
1019 іле і, пах, тџобех сі; 
іпе *Ғасіог сі; 
реһгеаа тиёех ё *тикехе$ ; 
} опе ҒЁасіог 5; 


уоіа *тагк Ёасёогѕ (уоіа *уіп) { 

опе _Ёасёог 5 *іп = уіп; 

1019 іп $1 = 2*іп->і; 

Ғог (1оп9 іп ѕса1е=2; $1 < іп->тах; ѕсаіе++, ѕі=ѕсаіе*іп->і) { 
реһгеаа тоёех 1оск (&іп->тиёехеѕ [51% іп->тџибех сё]); 
іп->Ғасіог сі [31]++; 
реһгеаа тоёех џип1оск (&іп->тибехеѕ [51% іп->тиёех сё]); 

} 

гебигп МОЦ; 


116 ма1п() { 
1опд 1пЕ тах = 1е7; 
іпЕ *Ғасіог сі = па11ос ($17е0 (іпі) * тах); 


іпЕ Єћгеаа сё = 4, тоѓех сі = 128; 

рЕһгеаа ё ёћгеааѕ [+һгеаа сё]; 

реһгеаа тисех і тобехеѕ [тисех_ се]; 

Ғог (1оп9 116 1=0; 1< тоѓех сі; 1++) 
реһгеаа тоёех іпії (&тоёехеѕ [1], М0); 


Ғасёог сі [0] 0; 

Ғасбог сё [1] 1; 

Ғог (1оп9 іп 1=2; 1< тах; 1++) 
Ғасбог сё[і] = 2; 


опе Ғасіог 5 х[ћгеаа сё]; . 
Еог (1опд іпё 1=2; 1<= тах/2; і+=Ёһгеаа сі) { 
// от лишних потоков вреда не будет 
Ғог (іп 6=0; Е < ёһгеаа сё && &+1 <= тах/2; ++) { 
х[ Е] = (опе Ғасіог 5) {.і=і+і, .тах=тах, 
.Еасёог сі=Ғасіог сё, „тикехез=тикехез, 
.тосех_сё=тобех сі}; 
реһгеаа сгеасе (&@һгеааѕ [0], МОГ, тагк Ёасбогѕ, &х[*]); © 
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Ғог (іп 6=0; {< Єһгеаа сё; +++) 
рһгеаа јоіп (Епгеа4з[*], МОШ); ө 


} 

ЕТЬЕ *о=Ёореп ("хрё", "м"); 

Ғог (1оп9 іп 1=0; і < тах; і ++) { 
іпЕ Ёасіогѕ = Ғасбёог сё [1]; 
Ере1пЕЁ (о, "%1%11\п", Ғасіогѕ, 1); 


} 


Ес1оѕе (о); 


іпЕ тах Ёасіогѕ = де тах (Ёасіог сё, тах); 
Іоп9 іле ба11у[(тах Ғасёогѕ+1]; 
тетѕеє (са11у, 0, ѕігеої (1опд іпі) * (тах Ёасіогѕ+1)); 


{а11у_з Сһгеаа іпѓо [Еһгеаа сё]; 
Ғог (іп 1=0; 1< ёһгеаа сі; 1++) { 
Єһгеаа іп ёо [і] = (ба11у ѕ) {.һіѕ ёһгеаа=і, .Єһгеаа сі=һгеаа сё, 
.ба11у=ёа11у, .тах=птах, 
.Ғасёог сі=Ёасіог сі, .тоѓехеѕ=тибехеѕ, 
.тиѓех сё =тибех сё); 
рћгеаа сгеабе (&+ћгеайѕ [і], МОШ, ааа ба11у, &һгеаа іпғо[і]); 


} 
Еог (106 6=0; Е< Еһгеаа сё; +++) 
реһгеаа јоіп (єһгеааѕ [+], МОБ); 


Ғог (іп 1=0; і<=тах Ғасбогѕ; 1++) 
ргіпеё ("%і\%1і\п", 1, ба11у[1]); 

} 

© Одноразовый псевдоним типа {а11у_$ не только необходим для вызова рЕйгеад_ 
сгеаїе, но и существенно повышает безопасность. Мы, конечно, должны сле- 
дить за правильностью входов и выходов системы рёгеа4, но типы элементов 
структуры проверяются компилятором как в паіп, так и в этой функции-оберт- 
ке. Если через неделю я решу в качестве {а11у использовать массив чисел типа 
11%, но внесу изменения некорректно, компилятор предупредит меня. 

Ө Мьютексы рйгеа4 и ОрепМР очень похожи. 

Ө Здесь создается поток. Мы подготавливаем массив указателей на данные по- 
тока, а затем по одному передаем их функции рёћгеай сгеаѓќе вместе с функци- 
ей-оберткой и предназначенными для нее данными. Второй аргумент задает 
некоторые атрибуты потока, которые в этой главе вводного характера мы рас- 
сматривать не будем. 

© Во втором цикле собираются результаты. Второй аргумент функции рёћгеаа 

јоіп – это адрес, по которому мы могли бы записать результат исполняемой по- 
током функции (тагк Ѓасіогз). 

Фигурная скобка в конце цикла Ёог закрывает область видимости, поэтому все объявлен- 

1х ные в ней локальные переменные уничтожаются. Обычно мы не покидаем область види- 

мости, пока не вернут управление все вызванные функции, но смысл ріћгеай сгеаѓе в том 


и состоит, чтобы функция па1п продолжала работать одновременно с потоком. Поэтому 
такой код не годится: 


Ғог (іп 1=0; 1< 10; 1++) { 
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{а11у_5 һгеаа іпѓо = {...}; 
реһгеаа сгеабе (&@ћгеааѕ [1], МОГ, ада ѓба11у, &ЕПгеаЯ іпғо); 
} 


потому что переменная (Пгеа4_1пЁо уже будет уничтожена к тому моменту, как айі їа11у 
соберется ей воспользоваться. Перенос объявления вовне цикла: 


Са11у 5 ЕПгеаа_1пЕо; 
Ғог (іп 1=0; 1< 10; і++) { 

Єһгеаа іпёо = (6а11у_з) {...}; 

реһгеаа сгеабе (&һгеааѕ [1], МОШ, ада ба11у, &һгеаа іпғо); 
) 


тоже работать не будет, потому что данные, хранящиеся в Ёћгеай іпїо, будут затерты на 
второй итерации, хотя первая итерация еще не закончила их использовать. Поэтому мы 
создали массив данных для передачи функции и тем самым гарантировали, что данные 
потока не будут ни уничтожены, ни затерты во время запуска следующего потока. 


Какую награду мы получаем от ріћгеай за всю эту дополнительную работу? 
Больше возможностей. Например, ріћгеай гю1оск # – мьютекс, который блокирует 
поток, если какой-то другой поток изменяет защищаемый ресурс, но не препят- 
ствует одновременным операциям чтения. ріћгеай сопё # – семафор, который по- 
зволяет блокировать и разблокировать сразу несколько потоков после получения 
сигнала и может использоваться для реализации блокировок чтения-записи или 
мьютексов общего вида. Но чем больше гибкости, тем больше шансов сделать что- 
то не так. С помощью рёћгеаа очень легко написать тщательно оптимизированный 
многопоточный код, который будет работать быстрее, чем версия на ОрепМР на 
сегодняшнем тестовом компьютере, но окажется абсолютно неработоспособным, 
на компьютере, выпущенном через год. 

В спецификации ОрепМР нет никаких упоминаний о рёһгеад, а в специфика- 
ции РОЅІХ не упоминается ОрепМР, поэтому не существует сколько-нибудь офи- 
циального документа, требующего, чтобы семантика потока в смысле ОрепМР и 
в смысле РОЅІХ совпадала. Однако авторы компилятора должны были изыскать 
какой-то способ реализовать ОрепМР, РОЅІХ (или М№Міпӣомѕ) и библиотеки много- 
поточности для С, и разрабатывать разные методы организации потоков для каж- 
дой спецификации оказалось бы слишком накладно. Кроме того, у процессора нет 
особых ядер для р геа4 и для ОрепМР: у него имеется набор машинных команд 
для управления потоками, так что на компилятор возлагается задача свести все 
стандарты и спецификации к этому набору команд. Поэтому не будет таким уж 
грехом смешивать разные механизмы, например создать потоки с помощью прагмы 
ОрепМР и использовать мьютексы рёһгеаа или атомы С для защиты ресурсов или 
начать с ОрепМР азатем в какой-то части программы применить функции рёйгеа4. 


Атомы С 


В стандарте С описаны заголовки ѕіаёопіс.ћ и №геадз.1, в которых объявлены 
функции и типы для работы с атомарными переменными и потоками. Ниже я при- 
веду пример, в котором многопоточность организуется с помощью рћгеай, а для 
защиты переменных используются атомы С. 
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Существуют две причины, по которым я не использую потоки С. Во-первых, все 
примеры в этой книге протестированы, а на момент ее написания мне не удалось 
раздобыть комбинацию компилятора со стандартной библиотекой, в которой был 
бы реализован заголовок һгеадѕ.ћ. И это понятно в свете второй причины: пото- 
ки С построены по образцу потоков С++, при проектировании которых за основу 
были взяты средства, имеющиеся в системе потоков как УЛп4о\з, так и в РОЅІХ, 
поэтому потоки С по существу представляют собой просто переименование су- 
ществующих средств без добавления какой-то интригующей новой функциональ- 
ности. А вотатомы С вносят-таки новую лепту. 

Если имеется тип пу уре, скалярный, структурный или любой другой, то сде- 
лать его атомарным можно следующим образом: 


_АбКот1с (ту буре) х 


В одной из ближайших версий компилятора будет работать и конструкция 


_Абот1с ту буре х 


В этом варианте более понятно, что Аїотіс — это на самом деле квалификатор 
типа, как сопѕі. Для определенных в стандарте целочисленных типов можно ис- 
пользовать сокращенную запись аќотіс іпё х, абот1с_роо] хит. д. 

Простое объявление переменной как атомарной уже дает несколько преиму- 
ществ: х++, --х, х *= уи другие бинарные операции составного присваивания стано- 
вятся потокобезопасными (С11 $6.5.2.4(2) и 56.5.16.2(3)). Эти операции, а также 
все потокобезопасные операции, рассматриваемые ниже, последовательно непро- 
тиворечивы (обсуждение этого понятия в контексте атомов ОрепМР см. в разделе 
«Последовательная непротиворечивость» выше). На самом деле в спецификации 
ОрепМР “4.0 52.12.6 говорится, что атомы ОрепМР и атомы С11 ведут себя оди- 
наково. Однако для выполнения всех остальных операций необходимо пользо- 
ваться специальными функциями. 

О Выполнить инициализацию путем вызова а{от1с іпії (вуоџг уаг, ѕёагііпд 
уа1), которая устанавливает начальное значение «одновременно с инициа- 
лизацией дополнительного состояния, которое может быть необходимо 
реализации для поддержки атомарного объекта» (С11 $7.17.2.2(2)). Эта 
функция не является потокобезопасной, поэтому вызывать ее следует до 
создания потоков или защищать мьютексом либо критической областью. 
Существует также макрос АТОМІС УАВ_Т\Т, который можно поместить в стро- 
ке объявления для достижения того же эффекта, то есть варианты 


_Асотіс іпе і = АТОМТС_\УАВ_ТМТТ (12); 
// или 


_Аботіс іпЕ х; 
асотіс іпіє (&х, 12); 


эквивалентны. 
О Использовать функцию аїотіс ѕЁоге (вуоџг уаг, х), чтобы потокобезопас- 
ным образом присвоить переменной уоџг үаг значение х. 
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О Использовать выражение х = абот1с 1оа4 (ёуоиг чаг), чтобы потокобезопас- 
ным образом прочитать значение переменной уойг_уаг и присвоить его пере- 
менной х. 

Использовать выражение х = а{от1с_ехсвапде (&уошг чаг, у), чтобы записать у 
в уоџг уаг и скопировать в х предыдущее значение уойг_уаг. 

Использовать выражение х= аёотіс Ғеёсһ ааа (вуоџг үаг, 7), чтобы прибавить 
семь к переменной уоџг үаг и записать в х значение, которое эта переменная 
имела до сложения; функция аёотіс Ёесһ ѕир аналогично производит вы- 
читание, но не существует функций аёопіс Ёеёсћ пи] и аёотіс Ёесћ 91“. 

Об атомарных переменных можно говорить еще долго, в том числе и потому, 
что комитет по стандартизации С надеется, что в будущих реализациях библио- 
тек многопоточности атомарные переменные будут использоваться для создания 
мьютексов и других подобных конструкций в рамках стандартного С. Поскольку я 
не предполагаю, что вы станете реализовывать мьютексы самостоятельно, то и не 
буду останавливаться на соответствующих средствах (в частности, на функциях 
асотіс сотраге ехсһапде меак и зігопд, предназначенных для реализации операции 
«сравнить и обменять»). 

Ниже приведен наш сквозной пример, переписанный с использованием ато- 
марных переменных. Я использую для организации многопоточности библиотеку 
рЕгеа4, поэтому программа достаточно длинная, но все словеса, связанные с мью- 
тексами, устранены. 


Пример 12.8 * Подсчет делителей с использованием атомарных переменных 
(с _ѓасїогѕ.с) 


#1пс1а4е <рећгеаа.һ> 
#1пс14е <ѕёааёотіс.һ> 
#іпсіџае <56а1ір.һ> //та11ос 
#іпсіџдӢе <ѕёгіпд.һ> //тетѕеё 
#1пс1и4е <51аіо.һ> 


іле деб тах Ёасёогѕ ( Асотіс (іп) *Ғассог сё, 1опд іпі тах) { 
// в одном потоке, чтобы избежать словоблудия 
іпЕ д1ора1 тах=0; 
Ғог (1опд 11 1=0; 1< тах; 1++) { 
1Е (Еаског_с®[1] > 91оБа1 тах) 
91оЬа1_ тах = Ғасбог сё [і]; 
} 
гекигп д1ора1 тах; 


} 


СуредеЁ ѕігисі { 
_Аботіс (1019 11%) *6а11у; 
_Аботіс (іпё) *Ёасбог сі; 
іп тах, Ёһгеаа сё, ёһіѕ Єһгеаа; 
} ба11у $; 


уоіа *ада ба11у (уоіа *уіп) { 
ба11у ѕ *іп = уіп; 
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Ғог (1оп9 іп 1=1п->611$_(пгеаа; і < іп->тах; і += іп->Еһгеаа сі) { 
116 Ёасіогѕ = іп->Ғасёог сё [1]; 
іп->&ёа11у[Ғасёогѕ] ++; © 
} 
гебогп МОБ; 
} 


фуреаеЁ ѕігисі { 

1оп9 іпё і, тах; 

_Аботіс (іп) * Ғасёог сё; 
} опе Ғасбог 5; 


уоіа *тагк Ёасёогѕ (уоіа *уіп) { 
опе Ғасіог ѕ *іп = уіп; 
1019 іпё $1 = 2*іп->і; 
Ғог (1оп9 іп ѕса1е=2; $31 < іп->тах; ѕса1е++, ѕі=ѕсаіе*іп->і) { 
іп->Ғасіог сі [31]++; 
} 
гевигп МОШ; 
} 


іп маіп () { 
1опд іп тах = 1е4; 
_Асотіс (іп) *Ғасіог сі = та110с(ѕігеоЁ (_Асотіс (іпї)) *тах); © 


іпЕ Єћгеаа сё = 4; 
реһгеаа ё ёһгеааѕ [Еһгеаа сі]; 


асотіс іпії (Ғасіог сі, 0); 

аіотіс іпіё (Ғасіог сё+1, 1); 

Ғог (1оп9 іпё 1=2; 1< тах; 1++) 
аіотіс іпіє (Ғасіог сі+і, 2); 


опе _Ғасіог ѕ х[Еһгеаа сі]; 
Ғог (1Іоп9 іп 1=2; і<= тах/2; і+=ёһгеаа сё) { 
Ғог (іп 6=0; Е < Еһгеаа сі && {+1 <= тах/2; С++) { 
х[Е] = (опе Ғасіог 5) {.і=і+ё, .тах=тах, 
.асёог сё=Ғасёог сі); 
рећһгеаа сгеаѓе (&@ћгеааѕ [6], МОШ, тагк Ғасёогѕ, х+); 
} 
Ғог (106 6=0; {< Еһгеаа сі && Ё+і <=тах/2; &++) 
реһгеаа јоіп (+ёһгеааѕ [+], МОШ); 
} 


іпё тах Ғасёогѕ = де тах_ЁРаскогз (Ғасёог сё, птах); 
_Аботіс (1опд іп) ба11у[тах Ғасёогѕ]; 
петѕеѓ (ба11у, 0, ѕігеоЁ (1опд іпё) *тах ҒЁасіогѕ); 


{а11у_$ ёһгеаа іпғѓо [Єһгеаа сї]; 
Ғог (іп 1=0; 1< ёһгеаа сі; 1++) { 
(Вгеаа_1по[1] = (ба11у 5) {.11$ Еһгеай=і, .һгеаа сі=іһгеаа сі, 
.Са11у=ёа11у, .тах=тах, 
.асёог сё=Ғасіог сі); 
рећгеаа сгеаёе (&+һгеайѕ [і], МОШ, ада ба11у, Єһгеаа іпғо+і); 
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} 
Еог (іп 6=0; {< ёһгеаа сё; ++) 
реһгеаа јоіп (ёһгеааѕ [6], МО); 
Ғог (іп 1=0; і<тах Ғасбогѕ; 1++) 
ргіпе# (" %і\ЕФ1і\п", 1, ба11у[і]); 
} 


© Раньше для защиты этой строки мы использовали мьютекс или прагму #ргадта 
отр аѓопіс. Но поскольку элементы массивы {а11у объявлены атомарными, га- 
рантируется, что простые арифметические операции будут потокобезопасными 
и так. 

Ө Ключевое слово _А{от1с – квалификатор типа, как и сопзі. Но, в отличие от сопзі, 
типы абопіс іпё и просто 114 могут не совпадать по размеру (С11 56.2.5(27)). 


Атомарные структуры 


Структуры могут быть атомарными. Однако «доступ к члену атомарной структу- 
ры или объединения приводит к неопределенному поведению» (С11 $6.5.2.3(5)). 
Поэтому для работы с ними необходима определенная дисциплина: 

О скопировать разделяемую атомарную структуру в неатомарную локаль- 
ную структуру того же базового типа: ѕгисі ї ргітаёе ѕігис = аёотіс Іоай 
(&ѕћагеа ѕігисі); 

О выполнить необходимые операции с локальной копией; 

О скопировать модифицированную локальную копию обратно в атомарную 
структуру: аёотіс зїоге (6ѕћагед ѕігисё, ргітаѓе ѕігисі). 

Если одну структуру могут модифицировать два потока, то нет никакой гаран- 
тии, что между чтением на первом шаге и записью на третьем структура не будет 
изменена. Поэтому следует позаботиться о том, чтобы в каждый момент времени 
запись мог производить только один поток - в силу логики программы или с по- 
мощью мьютексов. Однако для чтения структуры мьютекс больше не нужен. 

Рассмотрим специализированную программу поиска простых чисел. Приме- 
ненный выше метод «просеивания» (вариант решета Эратосфена) в моих тестах 
искал простые числа гораздо быстрее, но эта версия демонстрирует элегантное ис- 
пользование атомарной структуры. 

Я хочу проверить, что число-кандидат не делится нацело ни на какое меньшее 
число. Но если число не делится на З и не делится на 5, то оно заведомо не делится 
на 15, поэтому нужно лишь проверять, что число не делится на меньшие простые 
числа. Кроме того, не имеет смысла проверять множители, большие половины 
числа-кандидата, потому что максимально возможный множитель удовлетворяет 
соотношению 2 * множитель = кандидат. Таким образом, можно написать псевдо- 
код: 

Еог (сапаідаѓе іп 2 (о а ті11]іоп) { 
іѕ ргіте = Егие 
Рог (беѕі іп (простые числа, меньшие сапаійаѓе/2) 


1 ((сапаідаёеѕ/ёеѕі) делится без остатка) 
15 ргіте = Ёа1зе 
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Остается единственная проблема – поддерживать список простых чисел, мень- 
ших сапд1аке/2). Нам нужен список переменного размера, то есть придется вы- 
зывать геа]10с. Я собираюсь использовать простой массив без маркера конца, по- 
этому нужно будет где-то хранитьего длину. Мы имеем идеальную ситуацию для 
применения атомарной структуры, потому что массив и его длина должны быть 
синхронизированы. 

В приведенной ниже программе ргіпе 1156 — структура, разделяемая всеми по- 
токами. Как видите, ее адрес несколько раз передается функциям в виде аргумента, 
но во всех остальных случаях он используется лишь в аёопіс іпії, аботіс ѕЁоге и 
асопіс Јоаа. Структура модифицируется только в функции аай а ргіпе, и делается 
это, как описано выше: сначала копирование в локальную структуру, а затем мани- 
пуляции сэтой локальной структурой. Эти действия защищены мьютексом, потому 
что одновременное обращение к геа110с из двух потоков привело бы к катастрофе. 

В функции ѓеѕё а пипрег есть еще одно тонкое место: она ждет, пока в списке 
ргіпе 115% не окажутся все простые числа, не превышающие сапіідаїе/2, и только 
потом приступает к работе, чтобы не пропустить какой-нибудь множитель. Это 
работает благодаря свойствам простых чисел; можно доказать, что программа не 
окажется в ситуации взаимоблокировки, когда каждый поток ждет завершения 
другого, чтобы продолжить работу. В остальном алгоритм точно следует написан- 
ному выше псевдокоду. Отметим, что в этой части кода нет мьютексов, потому что 
а{от1с_1оа4 используется только для чтения структуры. 


Пример 12.9 < Использование атомарной структуры для поиска простых чисел 
(с _ритез.с) 


#іпс1џае <ѕЕаіо.һ> 

#іпс1џоде <ѕёдӢаёотіс.һ> 
#іпс1џае <ѕёа1ір.һ> //та11ос 
#іпс1џдӢе <ѕеароо1.һћ> 
#1пс1и4е <рёһгеаа.һ> 


Сурейе# зігоисі { © 
Іоп9 іп *р1іѕі; 
Іоп9 іпе Іепдёһ; 
1опд іпё тах; 

} ргіте 5; 


іпЕ ааа а ргіте (_Асотіс (ргіте 5) *ріп, 1опд ілі пем ргіте) { 
ргіте 5 р = асотіс 1Іоаа (ріп); [2 
р.1Іепдбћ++; 
р.р1іѕї = геа11ос(р.р1іѕіё, ѕігеоЁ (1опд іпё) * р. 1Іепдќћ); 
1ЁЕ (!р.р11$8) гебиагп 1; 
р.р1іѕє[р.Іепаёһћ-1] = пем ргіте; 
1Е (пем ргіте > р.тах) р.тах = пем ргіте; 
асотіс зіоге (ріп, р); 
гевигп 0; 


} 


суреаеЕ ѕігисі { 
1Іоп9 іп і; 
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_АСотіс (ргіте 5) *ргіте 115; 
реһгеаа тоёех ё *тикех; 


} ёеѕё 5; 


уоіа* ёеѕё а пипрег (уоіа *уіп) { 


} 


Сеѕі ѕ *іп = уіп; 
1оп9 іп і = іп->і; 
ргіте ѕ руіем; 
ао { 
ру1ем = аёотіс 1Іоаа (іп->ргіте 1150); 
} мһі1е (руіем.тах*2 < і); 


Боо1 іѕ ргіте = Єгое; 
Рог (іп ј=0; ј < руіем.1епдїһ; ј++) 
1Ё (! (1% руіем.р1ї56[3])){ 
іѕ ргіте = ЃЁа1ѕе; 
ргеак; 


} 


1#Е (15 ргіте) { 
ріћгеаа пџиѓех Іоск (іп->тиќех); © 
іпЕ гебуа1 = ада а ргіте (1п->рг1те_113$%, і); 
1Ё (геёуа1) {ргіпё# ("Слишком много простых чисел. \п"); ехії (0); } 
реһгеаа тибех оп1оск (іп->тоибех); 
} 
геёигп МОГГ; 


іпЕ таіп () { 


ргіте 5 іпіѕ = {.р115&=МОЬЬ, .Іепдёһ=0, .тах=0}; 
_Аботіс (ргіте 5) ргіте 115 = АТОМІС МАК ІМІТ (іпіїѕ); 


реһгеаа тоёбех Є т; 
реһгеаа тоёех іпіё (&т, МОШ); 


іпЕ Еһхеаа сі = 3; 
Сеѕі з Еѕ[һгеаа сё]; 
реһгеаа ё Епгеааз [—ћһгеаа сё]; 


ааа а ргіте (&ргіте 1іѕї, 2); 
1Іоп9 іп тах = 1е6; 
Ғог (1оп9 іп 1=3; 1< тах; і+=һгеаа сі) { 
Ғог (іп =0; Е < ёћгеаа сё && %+1 < тах; ++) { 
Є5[6] = (Безе 5) {.1 = 1+6, .ргіте 1іѕё=&ргіте 1іѕї, .тибех=&т}; 
реһгеаа сгеаее (ёһгеааѕ+і, МОГ, беѕі а потрег, 5+6); 
} 
Ғог (іп 0=0; < ёһгеаа сі && Ё+і <тах; С++) 
рећһгеаа јоіп (ёһгеааѕ [Е], МОШ); 
} 


ргіте_5 руіем = аёотіс Іоаа (&рг1те_115%); 
Рог (іп ј=0; ј < ру1ем.1епаЕН; ј++) 
ргіпёё ("$11\п", руіем.р115#[3]); 
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© Сам список и его длина должны быть синхронизированы на всем протяжении 
перераспределения памяти, поэтому мы помещаем их в структуру и объявляем 
только атомарные экземпляры этой структуры. 

Ө В этой функции применяется регламентированная процедура: загрузка атомар- 
ной структуры в локальную неатомарную копию, модификация копии и обрат- 
ное сохранение копии в атомарной структуре. Эта процедура не является пото- 
кобезопасной, поэтому в каждый момент времени выполнять ее может только 
один поток. 

Ө Поскольку функция ад а ргіпе не потокобезопасная, защищаем обращения 
к ней мьютексом. 


В этой главе мы рассмотрели ряд способов параллельного выполнения кода. 
Применение ОрепМР позволяет очень просто – с помощью одной аннотации – 
создавать потоки и ожидать их завершения. Сложности возникают с отсле- 
живанием переменных: все переменные, встречающиеся в распараллеленном 
участке программы, должны быть классифицированы и обрабатываться соот- 
ветственно. 

Проще всего обстоит дело с переменными, которые только читаются; за ними 
следуют переменные, которые создаются и уничтожаются в пределах одного по- 
тока и, стало быть, не взаимодействуют с другими потоками. Отсюда вытекает, что 
функции следует писать так, чтобы они не модифицировали входных аргументов 
(то есть все указатели должны быть помечены квалификатором сопѕі) и не имели 
других побочных эффектов. Такие функции можно выполнять параллельно без 
опасений. В каком-то смысле такие функции существуют вне времени и окруже- 
ния: так, если зип — функция суммирования, то вызов зип (2, 2) всегда возвращает 4, 
как бы часто он ни выполнялся и что бы ни происходило в другом месте. Сущест- 
вуют так называемые чисто функциональные языки, которые всячески поощряют 
пользователя работать только с подобными функциями. 

Переменные состояния изменяются в процессе выполнения функции. Если 
функция содержит переменные состояния, то она теряет не запачканную време- 
нем чистоту. Если выполнить функцию, возвращающую баланс счета, сегодня и 
завтра, то полученная величина может различаться. Философия приверженцев 
чисто функционального программирования сводится к простому правилу: дер- 
жаться подальше от переменных состояния. Но они возникают неизбежно, по- 
тому что наши программы описывают мир, полный состояний. Читая работы, 
посвященные функциональному программированию, забавно следить, насколь- 
ко далеко автор сможет зайти, не упомянув о состоянии. Например, Абельсоп 
[аБеІѕоп-1996] прошел примерно треть пути (до стр. 217) и только потом признал, 
что мир изобилует состояниями: балансы банковских счетов, генераторы псевдо- 
случайных чисел, электрические цепи. 
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Большая часть этой главы была посвящена тому, как обращаться с переменны- 
ми состояния в распараллеленном окружении, после того как время распалось. 
В нашем распоряжении есть несколько инструментов снова склеить время, в том 
числе атомарные операции, мьютексы и критические области. Все они позволя- 
ют сериализовать операции изменения состояния. Но поскольку требуется время 
на их реализацию, верификацию и отладку, то проще всего избегать переменных 
состояния, а к функциям, зависящим от времени и окружения, прибегать только 
в крайнем случае. 


пз |3 
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Библиотеки 


И если бы я действительно хотел чему-то 
научиться, то слушал бы новые записи. 
Так поступаю я. И вы. И мы. 


— Тће Ніуеѕ «Опешогей Үоисћ» 


В этой главе мы рассмотрим несколько библиотек, которые могут облегчить жизнь 
программиста. 

Мне кажется, что с течением времени написанные на С библиотеки стали менее 
педантичными. Еще десять лет назад типичная библиотека предлагала минималь- 
ный набор средств, и ожидалось, что удобные для программирования надстрой- 
ки над ними вы напишете сами. Предполагалось, что вы сами будете выделять 
память, потому что недостойно библиотеки цапать память без спросу. Напротив, 
библиотеки, представленные в этой главе, предоставляют «простой» интерфейс, 
как, например, функции типа сиг] еаѕу ... в СОВГ. или единственная функция 
Заше, которая выполняет все неприглядные шаги транзакции базы данных. Если 
функции понадобится для работы промежуточная память, она выделит ее. Рабо- 
тать с такими функциями – одно удовольствие. 

Я начну с относительно стандартных библиотек общего характера, а потом пе- 
рейду к своим любимым библиотекам более узкой направленности: ЗОГ. ке, СМО 
Заепийс Г4Ьгагу, іЬхт!2 и НЬсОВГ. Я не знаю, для чего используете язык С вы, 
но эти библиотеки представляют собой удобные и надежные средства решения 
широкого круга задач. 


Сир 
Поскольку стандартная библиотека отнюдь не всеобъемлюща, естественно, что 
со временем появились библиотеки, заполняющие пробелы. В библиотеке СЬ 
реализовано столько базовых вычислительных средств, что она вполне могла бы 
сдать за вас экзамен за первый курс обучения информатике. Кроме того, она пере- 
несена практически на все платформы (включая даже издания Міпіомѕ, не под- 
держивающие РОЅІХ) и достаточно стабильна, так что на нее можно положиться. 

Я не стану специально приводить примеры кода с использованием СТА, по- 
скольку они уже встречались ранее, а именно: 

О краткое введение в связанные списки (пример 2.2); 

О тестовая оснастка в разделе «Автономное тестирование»; 

О средства работы с Опісойе в разделе «Опісойе»; 
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О хэши в разделе «Обобщенные структуры»; 

О считывание текстового файла в память и использование совместимых с Рег] 

регулярных выражений в разделе «Подсчет ссылок». 

А ниже, в разделе «Использование ттар при работе с очень большими набора- 
ми данных», я еще упомяну имеющиеся в СТ4Ь средства для обертывания систем- 
ного вызова плар в РОЅІХ ив Міпаомѕ. 

Но и это не все. При написании оконной программы, в которой используется 
мышь, вам понадобится цикл обработки событий для перехвата и диспетчери- 
зации событий мыши и клавиатуры – в СІЛЬ он есть. Включены также средства 
для работы с файлами, которые правильно ведут себя в системах, совместимых 
со стандартом РОЅІХ и прочих (читай: в \УЛп4до\з). Имеются также простой ана- 
лизатор конфигурационных файлов и облегченный лексический анализатор для 
более сложных задач. И так далее. 


Стандарт РОЅІХ 


Стандарт РОЅІХ добавил несколько полезных функций в стандартную библиоте- 
ку С. Учитывая, насколько широко распространен РОЅІХ, знания об этих функ- 
циях будут нелишними. Ниже я расскажу об использовании двух особенно по- 
лезных средств: разбор регулярных выражений и проецирование файла на память. 


Разбор регулярных выражений 


Регулярные выражения предлагают нотацию, позволяющую записывать образцы 
для сравнения с текстом, например «число, за которым следует одна или более 
букв» или «строка должна содержать число, запятую, пробел, число и больше 
ничего». Этим словесным описаниям соответствуют такие регулярные выраже- 
ния: [0-9] \+[[:а1рва:] Ј\+и ^[0-9]\+, [0-9] \+\5. Стандарт РОЅІХ определяет набор 
С-функций для разбора регулярных выражений, записанных с соблюдением опре- 
деленных грамматических правил. Эти функции включены в сотни инструментов. 
Не будет преувеличением сказать, что я пользуюсь ими ежедневно – либо в виде 
совместимых с РОЅІХ утилит (5ед, анк, дер), либо непосредственно в своих про- 
граммах для разбора текста. Например, они позволяют найти имя человека в фай- 
ле или, имея диапазон дат вида "04Арг2009-127Ј0п2010", выделить из этой строки 
шесть полей. Или найти маркеры глав в беллетризованном трактате о китах. 


{ в. Для разбиения строки на лексемы, разделенные одним каким-то символом, лучше ис- 
= ’ пользовать функцию ѕїгіок. См. раздел «Песнь о $ОК» на стр. 199. 

Однако я решил не включать в эту книгу руководство по регулярным выраже- 
ниям. Поиск по запросу «тевшат ехргезяюоп опа дал 12 900 ссылок. На машине 
с Ипих команда пап 7 гедех напечатает краткую справку, а если у вас установлен 
Рег], то команда пап рег1ге расскажет о совместимых с Рег! регулярных выраже- 
ниях (РСКЕ). В работе [Егіеа! 2002] вы найдете отличное освещение темы с при- 
личествующими книге подробностями. Здесь же я покажу только, как регулярные 
выражения работают в библиотеке С, совместимой с РОЅІХ. 
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Существует три основных типа регулярных выражений. 
О Базовые регулярные выражения (ВКЕ) были представлены в первоначаль- 
ном варианте. В них было всего несколько специальных символов, напри- 
мер * означала 0 или более повторений предшествующего атома, то есть 
выражение [0-9] * представляло необязательное целое число. Для исполь- 
зования дополнительных возможностей нужно было употреблять знак об- 
ратной косой черты, предваряющий специальный символ; так, одна или не- 
сколько цифр обозначались конструкцией \+, поэтому целое число со знаком 
плюс можно было представить выражением + [0-9] \+. 
О Расширенные регулярные выражения (ЕКЕ) - второй вариант. Основное 
отличие – употребление специальных символов без обратной косой черты 
и экранирование их в обычном тексте с помощью обратной косой черты. 
Теперь регулярное выражение для целого числа со знаком плюс стало запи- 
сываться в виде \+[0-9] +. 
О В Рем регулярные выражения встроены в сам язык, и авторы внесли ряд 
существенных добавлений в их грамматику, в том числе возможность загля- 
дывания вперед и оглядывания назад, нежадные кванторы, удовлетворяю- 
щиеся минимально возможным совпадением, и внутренние комментарии. 
Первые два типа регулярных выражений реализованы в виде небольшого на- 
бора функций, определенных в стандарте РОЅІХ. Скорее всего, они есть в вашей 
стандартной библиотеке. Совместимые с Рег| регулярные выражения находятся 
в библиотеке іЫрсге, которую можно скачать из Сети или установить с помощью 
менеджера пакетов. Подробное описание функций из этой библиотеки дает ко- 
мапда пап рсгеарі. СІіЬ предоставляет удобную высокоуровневую надстройку над 
реге; как она используется, см. в примере 11.18. 

Поскольку регулярные выражения – неотъемлемая часть РОЅІХ, программа, 
приведенная в примере 13.2, будет компилироваться на платформах 1іпих и Мас 
без всяких флагов компилятора, помимо необходимых: 


СЕЬАС5="-д -Ма11 -03 --5ѕ.а=9пи11" таке гедех 


Оба интерфейса, РОЅІХ и РСКЕ, используются одинаково, процедура состоит 

из четырех шагов: 

О откомпилировать регулярное выражение с помощью функции гедсопр или 
рсге сопрі]е; 

О сопоставить строку с откомпилированным регулярным выражением с по- 
мощью функции гедехес или рсге ехес; 

О если в регулярном выражении были запоминаемые группы, то выделить 
соответствующие им части строки можно, воспользовавшись смещениями, 
которые возвращает функция гедехес или рсге ехес; 

О освободить память, отведенную для откомпилированного выражения. 

Для выполнения первых двух и последнего шага достаточно одной строки кода, 

так что если вас интересует только, соответствует ли строка регулярному выра- 
жению, то все просто. Не буду вдаваться в детальное обсуждение флагов и ис- 
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пользования функций гедсопр, гедехес и гедёгее, потому что раздел относящегося 
к ним стандарта РОЅІХ воспроизведен в страницах руководства в [Гіпих и ВЅр 
(наберите команду пап гедехес), а также на очень многих сайтах. 

Если требуется выделить подстроки, то ситуация немного усложняется. Круг- 
лые скобки внутри регулярного выражения означают, что требуется найти соот- 
ветствие частичному образцу в этих скобках (даже если ему соответствует только 
пустая строка). Таким образом, образец " (.*) о" в грамматике ЕКЕ сопоставляет- 
ся со строкой "ће110" и в качестве побочного эффекта сохраняет самое длинное 
совпадение с .*, каковым является ће!1. Третий аргумент функции гедехес – это 
количество заключенных в скобки подвыражений, в примере ниже я назвал его 
паесвсоипе. Четвертый аргумент гедехес – массив из паїсһсоџпі+1 элементов типа 
гедпаісћ ё. Тип гедтаїсћ ї состоит из двух полей: гт ѕо содержит начало совпав- 
шей подстроки, а гп ео — ее конец. В нулевом элементе массива хранятся начало 
и конец совпадения со всем регулярным выражением (представьте, что все оно 
заключено в скобки), а в последующих элементах – начало и конец подстроки, 
совпавшей с каждым подвыражением. Подвыражения нумеруются в порядке по- 
явления открывающих скобок. 

Предвосхищая грядущее, в примере 13.1 показан заголовок, в котором объяв- 
лены две служебные функции, реализованные в конце этого раздела. Функция 
гедех паёсһ и сопутствующие ей макрос и структура допускают именованные и 
необязательные аргументы (см. раздел «Необязательные и именованные аргу- 
менты» на стр. 231). Эта функция принимает строку и регулярное выражение и 
возвращает массив подстрок. 


Пример 13.1 * Заголовок с объявлениями служебных функций для работы 
с регулярными выражениями (гедех_#п$.п) 


суредеЁ зегисЕ { 
сопзЕ сһаг *3&г1па; 
сопзі сһаг *гедех; 
сһаг ***ѕџрѕігіпдѕ; 
_Воо1 изе_сазе; 

} гедех Ёп 5; 


#Аейпе гедех таёсһ (...) гедех таёсћһ Баѕе ( (гедех їп ѕ) {__ УА АКС5 }) 


1пЕ гедех тасһ раѕе (гедех Ёп ѕ іп); 
сһаг * ѕеагсһ апа гер1асе (сһаг сопѕі *раѕе, сһаг сопѕі *зеагсй, 
сһаг сопѕі *гер1асе); 


Отдельная функция для поиска и замены необходима, потому что в РОЅІХ ни- 
чего подобного нет. Если длины заменяемой и заменяющей строк различаются, 
то необходимо перераспределить память для исходной строки. Но у нас уже есть 
средства для разбиения строки на подстроки, поэтому ѕеагсћ апі гер1асе исполь- 
зует подстроки, соответствующие заключенным в скобки подвыражениям, чтобы 
разбить строку на части, а затем строит новую строку, вставляя в нужные места 
заменяющие подстроки. 


324 *% Часть |. Язык 


Функция возвращает МО, если совпадение не найдено, поэтому можно следую- 
щим образом выполнить глобальный поиск и замену: 
сһаг *52; 
мћһі1е((52 = ѕеагсһ апа гер1асе (1оп9 эігіпд, раёбегп))) { 
сһаг *&тр = Іоп9 ѕёгіпд; 
10п9_3Ег1п9 = 52; 
Ғгее (тр) ; 
} 


Этот код не очень эффективен: гедех паёсћ каждый раз заново компилирует 
регулярное выражение, а глобальный поиск и замена был бы эффективнее, если 
бы учитывался тот факт, что в части строки, предшествующей гези1{* [1] .гт ео, по- 
вторно искать не надо. В данном случае мы можем использовать С как язык раз- 
работки прототипа для С: сначала пишем простой вариант, а если профилировщик 
показывает, что этот вариант неэффективен, то заменяем его более эффективным. 

Ниже приведен сам код. Особо интересные строки помечены, а после кода при- 
ведены дополнительные замечания. В конце имеется тестовая функция, демон- 
стрирующая способы использования. 


Пример 13.2 + Служебные функции для работы с регулярными выражениями 
(гедех.с) 

#аеіпе _СМО_5О0ВСЕ //чтобы зЕ41о.В включал аѕргіпёѓ 

#1пс1иае "ѕёорі#.һ" 

#1пс1и4е <гедех.һ> 

#іпс1џде "гедех #пѕ.һ" 

#іпс1џде <ѕігіпд.һ> //з&г1еп 

#іпс10ае <5ѕ6а1іЫ.һ> //та11ос, тетсру 


збабіс іп соџпе рагепѕ (сопѕі сһаг *$&г1п9) { © 
116 оц = 0; 
116 1аѕіё маѕ раскѕіаѕћ = 0; 
Ғог (сопѕё сһаг *ѕёер=ѕёгіпд; *ѕёер !='\0'; ѕёер++) { 
1Е (*5Сер == '\\' && !1аѕ маѕ баскѕ1аѕћ) { 
1азЕ маѕ Баскѕіаѕћ = 1; 
сопбіпџе; 
} 
1Е (*5№ер == ')' && !1азЕ маѕ Баскѕіаѕһ) 
оцЕ++; 


Іаѕ маѕ раскѕіаѕћ = 0; 


} 


гебигп очё; 


} 


іп гедех тасһ Баѕе (гедех_Ёп_з іп) { 
Ѕёорії (!іп.ѕёгіпд, гебигп -1, "строка равна №011"); 
ЗЕор1Ё (!іп.гедех, гебцгп -2, "регулярное выражение равно МО"); 


гедех Е ге; 

іп таёсһсоцпі = 0; 

1Е (іп. ѕирзёгіпдѕ) таёсһсоџпё = соџпё рагепѕ (іп.гедех); 
гедтаёсһ_ ё геѕи1ї [таёсһсоџпе+1]; 
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іп сотрі1еа ок = !гедсотр (&ге, 1п.гедех, ВЕС_ЕХТЕМОЕР 9 
+ (іп.џѕе саѕе ? 0 : ВЕС ІСАЅЕ) 
+ (іл. ѕџирѕёгіпдѕ ? 0 : ВЕб_М№О59В) ); 
ЗЕор1Е (!сотріІеа ок, геогп -3, 
"Ошибка при компиляции регулярного выражения: \"%5\"", іп.гедех); 


106 Ғоџпа = ! гедехес (&ге, іп.ѕігіпд, таёсһсоцпё+1, геѕи1, 0); (3, 
1Е (!Ғоџпа) геёогп 0; 
іЁ (іп. ѕорѕёгіпдзѕ) { 
*іп.ѕорѕёгіпдѕ = та11ос ($12е0# (сһаг*) * таёсһсоцпё); 
сһаг **ѕ0ирѕігіпдѕ = *іп.ѕирѕігіпдѕ; 
// совпадение с индексом 0 соответствует всей строке, игнорируем 
Ғог (іп 1=0; і < таёсһсоцпё; і++) { 
1Е (геѕџ1є [1+1].гт ео > 0) { // особенность СМО: совпадение с пустой 
// подстрокой помечается как -1 
іп 1еп9ЕВ_оЁ таёсһ = геѕиіє[і+1].гт ео - геѕо1є [1+1] .гт 50; 
ѕорѕігіпдѕ [і] = та11ос ($&г1еп (іп. ѕёгіпд) +1); 
тетсру (ѕорѕёгіпадѕ [і], іп.ѕбгіпд + гези1е [1+1] .гт ѕо, 
Іепдёһ ої# таёсћ); 
ѕирѕёгіпдѕ [1] [1епосћ оғ таёсћ] = '\0'; 
} е1зе { // совпадение с пустой подстрокой 
ѕирѕігіпдѕ[і] = та110ос(1); 
ѕорѕёгіпдѕ[1] [0] = '\0'; 
} Я 
} 
1п.5$6г1п9 += геѕи1([0].гт ео; // конец совпадения со всем выражением 
} 
гедЁгее (&ге); © 
геёџгп маеспсоипе; 


сһаг * ѕеагсһ апа гер1асе (сһаг сопзЕ *раѕе, спаг сопѕі *ѕеагсһ, 
сһаг сопѕі *гер1асе) { 
сһаг *гедех, *о0џѓ; 
аѕргіпё (&гедех, "(.*) (%5) (.*)", ѕеагсһ); © 
сһаг **ѕирѕігіпдѕ; 
11 таёсћ сё = гедех паёсћ (Базе, гедех, &зирѕігіпдѕ); 
іЁ(таёсһћ сё < 3) геёцгп М№О11; 
аѕргіпё? (коо, "%5%5%5", ѕирѕігіпдѕ[0], гер1асе, ѕорѕёгіпдѕ[2]); 
Ғог (іп 1=0; 1< таёсһћ сё; 1++) 
Ғгее (ѕорѕёгіпдѕ[і]); 
Ғгее (ѕорѕігіпдѕ); 
геіцгп оиб; 


} 


#іҒаеҒ Сеѕі гедехеѕ 
116 таіп () { 
сһаг **ѕ0рѕігіпдѕ; 
іп таёсһћ сё = гедех таёсћһ ("Недоп1зт Бу Ёће а1рѕ, зауогу Еоо4$ " 
"аё еуегу теа1.", 
" ( [Не] *) ао. *а(.*) 5, (.*)ог.* ( [ет] *)а1", &500ѕёгіпдѕ); 
ргіпеЁ ("%і таёсһеѕ:\п", маёсһ сї); 
Ғог (іп 1=0; 1< таёсһ сі; 1++) { 
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ргіпёЁ ("[%5] ", ѕирѕёгіпдѕ[1]); 
Ғгее (ѕорѕігіпдѕ [1]); 

} 

Ғгее (ѕирѕігіпдѕ); 

ргіпёё ("\п\п"); 


таёсһ се = гедех таёсћ ("", "(([[:а1рһа:]]+) ([[:а1рва:]]+)", &50рѕёгіпдѕ); 
ЅЕоріЁ (таёсһ сі != 0, гебигп 1, "Еггог: таёсһеа а Б1апк"); 
ргіпіё ("Иісћһоце һе Г, Р1апёѕ аге: %5", 
ѕеагсһ апа гер1асе ("Р1апіз\п", "1", "")); 
} 
#епаі ЕЁ 


© Мы должны передать гедехес массив для хранения позиций совпавших подстрок 
и его длину, то есть предполагается, что мы знаем, сколько будет подстрок. Эта 
функция принимает регулярное выражение и подсчитывает, сколько в нем от- 
крывающих круглых скобок, не экранированных знаком обратной косой черты. 

Ө Здесь регулярное выражение компилируется в значение типа гедех _*. При по- 
вторном использовании эта функция неэффективна, так как выражение всякий 
раз компилируется заново. Оставляю читателю в качестве упражнения реали- 
зовать кэширование уже откомпилированных регулярных выражений. 

© Здесь используется гедехес. Если интересует только, есть совпадение или нет, то 
можно передать в качестве списка совпадений №011, а в качестве его длины 0. 

© Не забывайте освобождать внутреннюю память, отведенную для гедех _‹. 

Ө Принцип работы поиска и замены - разбить входную строку на отрезки (все до 
совпадения)(совпадение)(все после совпадения). Это регулярное выражепие 
решает поставленную задачу. 


Использование ттар для очень больших наборов данных 


Я уже упоминал о трех типах памяти (статическая, динамическая и автоматиче- 
ская). Но есть еще и четвертый: дисковая. Системный вызов птар позволяет спрое- 
цировать хранящийся на диске файл в область памяти. 

Именно так часто работают разделяемые библиотеки: система находит файл 
11рићаѓечег. ѕо и назначает отрезку этого файла, представляющему нужную функ- 
цию, адрес в памяти. Всё — функция загружена в память. 

Или другой пример использования – чтобы данные стали доступны несколь- 
ким процессам, эти процессы должны спроецировать в память один и тот же файл. 

Этим механизмом можно воспользоваться и для сохранения структур данных 
в памяти. Спроецируем файл в память, с помощью функции пеппоче скопируем 
находящуюся в памяти структуру данных в спроецированную область, и готово — 
структура сохранена до следующего раза. Проблемы возникают, когда структура 
данных содержит указатель на другие данные; преобразование последовательно- 
сти указателей в нечто, допускающее сохранение, называется сериализацией, я эту 
задачу рассматривать не буду. 

И, разумеется, проецирование позволяет работать с большими наборами дан- 
ных, не помещающимися в память. Размер спроецированного в память массива 
ограничен размером диска, а не оперативной памяти. 
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В примере 13.3 приведена демонстрационная программа. Большую часть ра- 


боты выполняет функция 1оа4 ппар. Если она используется в качестве та110с, то 
должна создать файл и «растянуть» его до нужного размера; если мы открываем 
уже существующий файл, то достаточно открыть и вызвать ттар. 


Пример 13.3 * Файл на диске можно прозрачно спроецировать в память (ттар.с) 


#іпс10џде <5ѕіаіо.һ> 

#1пс1и4е <ипіѕіа.һ> //1ѕеек, мгібе, с1озе 
#іпс10оде <5ѕа1ір.һ> //ехіб 

#ілпс1џдӢе <Ёспё1.һҺ> //ореп 

#іпс1џае <ѕуѕ/ттап.һ> 

#іпс1џае "ѕёорі#.һ" 


#аеѓіпе Марта11ос (питрег, ёуре, Н1епате, #а) \ © 


1оаа ттар ( (#1епате), &(Ёа), (потрег) *$12еоЕ (буре), 'у!) 


#аейпе Мар1оаа (питрег, буре, Й1епате, #4) \ 


1оаа ттар ( (Н1епате), & (Ға), (потрег) *512еоЕ (буре), 'п') 


#деѓіпе МарЁгее (потрег, буре, а, роіпёег) \ 


ге1еазетмтар ( (роіпёег), (потрег) *5ігеої (+уре), (Еа)) 


уоіа *1оаа ттар (сһаг сопѕі *#1епате, ілі *#а, ѕіғе ё 512е, сһаг паке гооп) { 9 


} 


* Ға=ореп (б1Іепате, 
паке гоот==' у! ? О_ВОИВ | О_СВЕАТ | О ТВОМС : О АОИ, 
(тоде 6) 0600); 

Ѕіорі# (*Ё4==-1, гебигп МОЬЬ, "Ошибка при открытии файла"); 


іЁ (таКе_гоот=='у'){ //Растянуть файл до размера спроецированного массива 
іпЕ геѕи1ё=1ѕеек (*Ё4, $12е-1, ЅЕЕК ЅЕТ); 
Ѕіорії (гези1{==-1, с1оѕе(* Ға); геёџгп МОШ, 
"Ошибка при растягивании файла с помощью 1ѕеек"); 
геѕиіё=мгіёе (* Ға, "", 1); 
ЗЕор1Ё (геѕи1!=1, с1оѕе(* #); геёџгп МОЦ, 
"Ошибка при записи последнего байта файла"); 


} 


уоіа *тар=ттар (0, $12е, РВОТ_ВЕАОР | РВОТ_ИВТТЕ, МАР_ЗНАВЕО, *#а, 0); 
ЗЕ ор1 Е (тар==МАР_ГАТЬЕО, гебигп МОЬЬ, "Ошибка при проецировании файла"); 
геигп пар; 


116 ге1еазетмар (уоіа *тар, ѕіге Е $12е, іп ға) { е 


} 


ЗЕор1Ё (топтар (мар, $12е) == -1, гебигп -1, 
"Ошибка при отмене проецирования файла"); 

с1о5е (ға); 

геёогп 0; 


іп таіп (іп агдс, сһаг *агду[]) { 


іпе ға; 
1оп9 іп №=1е5+6; 
іпё *тар = Марта11ос (№, іпё, "ттарреа.Ь1п", ға); 


Еог (1019 іпё і = 0; 1 <М№; ++1) тар[і] = і; Ө 
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МарЁгее (М, 1п%, Е4, тар); 


// Открыть заново и выполнить подсчеты. 
106 *геаате = Мар1оаа (№, іп, "птарреа.ЪЬ1п", ға); 


1опд 1опд іп оаазит=0; 
Ғог (1оп9 іп і = 0; і <№М; ++1) 1Е (геаате[1]%2) оаазим += і; 
ргіпёё ("Сумма нечетных чисел до%11:%111\п", №, одаѕип); 


МарЁгее (№, іп, #а, геаате); 


} 


© Яобернул следующие далее функции макросами, чтобы не приходилось всякий 
раз печатать $12е0# и не нужно было помнить о том, как вызывать 10а4 птар для 
выделения память, а как для загрузки. 

Ө Макросы скрывают тот факт, что функцию можно вызывать двумя способами. 
Если нужно только открыть существующие данные, то мы открываем файл, вы- 
зываем ттар и проверяем коды возврата. Если же функция используется для 
выделения памяти, то файл необходимо растянуть до нужной длины. 

Ө Для отмены проецирования нужно вызвать функцию пиппар, в чем-то похожую 
на функцию гее, парную па110с, и закрыть файл. Данные останутся на диске, 
так что на следующий день можно прийти, открыть тот же файл и продолжить 
с прерванного места. Чтобы вообще удалить файл, вызовите ип] 1пк ("#]епаме"). 

© Награда: невозможно сказать, что массив пар находится на диске, а не в обычной 
памяти. 


Несколько деталей: функция птар определена в стандарте РОЗ[Х, поэтому до- 
ступна всюду, кроме Міпдомѕ и некоторых встраиваемых систем. В \Мп4о\з име- 
ются идентичные механизмы, но с другими именами и флагами; см. документацию 
по функциям СгеаіеЕі1еМарріпо и Маруіеко#Еі1е. Библиотека СІ1Ь обертывает тлар 
и функции Міпӣомѕ с помощью конструкций вида 1# РОЗТХ .. е15е 1 Ніпӣомѕ .. и на- 
зывает все это 9 парред #1е пеи. 


Библиотека СМИ Ѕсіепіїйс Шбгагу 


Если кто-нибудь задаст вам вопрос, начинающийся словами «Я пытаюсь реализо- 
вать что-то из описанного в книге Митепса! Кесіреѕ т С... [Ргезз 1992]», то почти 
наверняка в ответ нужно посоветовать скачать библиотеку СМИ Заепийс ГаБгагу 
(С51.), потому что там все уже сделано [Соџећ 2003]. 

Одни методы интегрирования функций лучше, другие хуже, и, как сказано 
в разделе «Нерекомендуемый тип Йоаё» на стр. 164, некоторые кажущиеся впол- 
не разумными численные алгоритмы дают результаты настолько неточные, что 
правильными их нельзя назвать даже с натяжкой. Поэтому в области численного 
анализа применение существующих библиотек всегда окупается. 

И уж как минимум СЗГ. предлагает генератор случайных чисел (совмести- 
мый со стандартом С генератор на разных машинах может быть различен, что 


Глава 13. Библиотеки % 329 


не позволяет использовать его для получения воспроизводимых результатов) и 
структуры вектора и матрицы, которыми легко манипулировать. Даже если вы 
не занимаетесь денно и нощно численными расчетами, стандартные алгоритмы 
линейной алгебры, средства поиска минимумов функций, простейшие статисти- 
ческие показатели (среднее и дисперсия) и генераторы перестановок могут ока- 
заться полезны. 

А если вы знаете, что такое собственный вектор, бесселева функция или быст- 
рое преобразование Фурье, то найдете функции для их вычисления. 

Я приведу пример использования СЗ]. в примере 13.4, хотя имена, начинающи- 
еся префиксом 951 , встречаются в нем всего один-два раза. СЪ. — отличный при- 
мер библиотеки старой школы, которая предоставляет минимальный набор необ- 
ходимых инструментов, предполагая, что остальное вы напишете сами. Например, 
в руководстве по СЗТ. приводится целая страница стереотипного кода, который 
нужно написать в дополнение к предлагаемым функциям оптимизации, чтобы до- 
стичь желаемого эффекта. Невозможно избавиться от ощущения, что библиотека 
должна бы делать это сама, поэтому я написал набор функций, обертывающих 
некоторые части СЗТ, и в результате получилась библиотека Арорйета, предна- 
значенная для моделирования. Например, функция арор Чака связывает исходные 
матрицы и векторы СГ. с именами строк и столбцов и массивом текстовых дан- 
ных, что делает базовые структуры для численных расчетов ближе к тому, как вы- 
глядят реальные данные. Соглашения о вызове библиотечных функций следуют 
современным принципам, изложенным в главе 10. 

Оптимизатор устроен, как описано в разделе «Указатель на уоій и структура, на 
которую он указывает» на стр. 239: функция принимает произвольную функцию 
и использует ее как черный ящик. Оптимизатор подает данные на вход получен- 
ной функции и использует возвращенное значение для вычисления следующего 
входа, который должен дать большее значение. При достаточно изощренном алго- 
ритме поиска последовательность входных данных сойдется к значению, на кото- 
ром функция обращается в максимум. Таким образом, применение оптимизатора 
сводится к задаче написания оптимизируемой функции в надлежащей форме и 
передаче ее вместе с настройками оптимизатору. 

Для примера предположим, что дан список точек х,, х,, х... в некотором про- 
странстве (скажем, ®?) и что требуется найти точку у, для которой сумма расстоя- 
ний до всех заданных точек минимальна. Иными словами, если 0 — функция рас- 
стояния, то нужно найти точку у, минимизирующую выражение 0 (у, х,) + (у, х,) 
+р(у, х,) +... 

Оптимизатору необходима функция, которая принимает все заданные точки и 
точку-кандидат и для каждого х, вычисляет 0 (у, х;). Звучит очень похоже на опе- 
рацию тар-гедисе, и функция арор пар ѕип пользуется этим сходством (она даже 
распараллеливает обработку с помощью ОрепМР). Структура арор йаѓќа предо- 
ставляет единое средство задать набор точек х, суммарное расстояние до которых 
оптимизируется. Кстати, физики и СГ, предпочитают минимизацию, а экономис- 
ты и Арорћепіа – максимизацию. Это различие легко преодолевается добавлением 
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знака минус: вместо минимизации суммы расстояний следует максимизировать 
противоположное значение. 

Процедура оптимизации довольно сложна (какова размерность пространства 
поиска? где оптимизатору взять эталонный набор данных? какой алгоритм поиска 
применять?), поэтому функция арор еѕѓітаќе принимает структуру арор пойе1, со- 
держащую поля для функции и необходимой дополнительной информации. Мо- 
жет показаться странным называть минимизатор суммы расстояний моделью, но 
многое из того, что мы считаем статистическими моделями (линейная регрессия, 
метод опорных векторов, имитационное моделирование и т. д.), обсчитывается 
именно так: принимают данные, находят оптимум при заданной целевой функции 
и говорят, что этот оптимум является наиболее вероятным набором параметров 
для этой модели при указанных данных. 

В примере 13.4 показана полная процедура: написание функции расстояния, 
обертывание ее и всех необходимых данных структурой арор пое! и занимающее 
всего одну строку обращение к функции арор еѕїіптаќе, которая выполняет опти- 
мизацию и возвращает структуру модели, в которой описывается точка, миними- 
зирующая сумму расстояний до заданных точек. 


Пример 13.4 * Поиск точки, в которой достигает минимума сумма расстояний 
до заданных точек (951 _аіѕїапсе.с) 


#іпс1џде <арор.һ> 


дӢоџр1е опе іѕЇ (951 месіог *у1, уоіа *у2) { 
геєџгп арор уесёог діѕёапсе (у1, у2); 


} 


10оп9 аоџЬ1е 41$ апсе (арор_дафа *аёа, арор тойе1 *тоае1) { 
951 уесіог *агдеї = тойе1->рагатеёегѕ->уесіог; 
геєџгп -арор тар ѕит (даба, .Еп_ур=опе_41$е, „рагам=еагдее, .рагіё='г'); © 


} 


арор_то4е1 *тіп діѕёапсе= & (арор тоде1) { 


.пате="Міпітит аіѕёапсе ќо а ѕе оЁ іприё роіпіѕ.", .р=аіѕёапсе, (2, 
.уѕіғ2е=-1); 
іп таіп() { 
арор аба *1осаёіопѕ = арор даба Ға11ос((5, 2), © 
1:1, 2.2, 
4.8, 7.4, 
2.9; 8.6, 
=1:3 31 
2:49; 15а 
Арор тое1 ада дгоџр (тіп дӢіѕбапсе, арор т1е, .теёһоа="№М $1тр1ех", (а, 
.ЕоІегапсе=1е-5); 
Арор тойе1 ада дгоџр (тіп діѕёапсе, арор рагёѕ мапед); (5) 
арор пойе1 *еѕі=арор еѕіітаѓе (1осасіопѕ, тіп дізѕёапсе); © 


арор тоде1 зпом(ез®); 
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© Полагая .рагі='г', я говорю, что хочу применить функцию опе_415{ к каждой 
строке входного набора данных. Знак минус присутствует, потому что мы при- 
меняем систему, выполняющую максимизацию, для минимизации расстояния. 

Ө Элемент .\512е напоминает, что под капотом арор еѕіітаїѓе много чего делает. 
При этом выделяется память для элемента, содержащего параметры модели, 
а значение -1 означает, что количество параметров должно быть равно коли- 
честву столбцов в наборе данных. 

© Первый аргумент функции арор_Ча{а_Ёа110ос — это список, содержащий коли- 
чество точек и их размерность; затем идут сами данные: пять точек в двухмер- 
ном пространстве. См. раздел «Несколько списков» на стр. 216. 

Ө В модель можно добавить группы настроек, полезные для различных функций. 
В этой строке мы добавляем сведения, касающиеся оптимизации: использовать 
симплекс-метод Нелдера-Мида и стремиться, чтобы погрешность составляла 
менее 1е—5. При наличии параметра .уегрозе=1 будет выводиться дополнитель- 
ная информация о каждой итерации поиска оптимума. 

Ө Поскольку библиотека Арорћепіа предназначена для статистических расчетов, 
она вычисляет ковариацию и другие статистические характеристики парамет- 
ров. Если эти вещи вас не интересуют, то их вычисление было бы пустой тратой 
времени, поэтому мы задаем пустую группу арор рагіѕ мапїей, показывая, что 
никакая дополнительная информация не нужна. 

Ө Теперь все подготовлено и можно выполнить собственно оптимизацию: найти 
точку, в которой функция тіл діѕёапсе принимает минимальное значение при 
заданных точках. 


5ОЩе 


Структурированный язык запросов (501) позволяет человеку взаимодейство- 
вать с базой данных. Поскольку база данных обычно хранится на диске, она может 
быть сколь угодно большой. Язык $01 среди прочего обладает двумя свойствами, 
особенно важными при работе с большими наборами данных: умение выделять 
подмножество данных и соединение наборов данных. 

Я не стану углубляться в описание ЗОГ, поскольку этой теме посвящены тол- 
стенные тома. Если мне будет позволено процитировать самого себя, то в кни- 
ге [КІетепѕ 2008] имеется глава, посвященная 501 и работе с ним из С. Можете 
также задать поисковику запрос $41 Еопа[. Основы довольно просты. Я сделаю 
акцент на знакомстве с библиотекой ЗОГ Це. 

ЗОГ ие реализована в виде одного С-файла и одногозаголовка. В этот файл вхо- 
дят анализатор ЗОТГ-запросов, различные внутренние структуры и функции для 
доступа к данным в файле на диске и несколько десятков интерфейсных функ- 
ций для взаимодействия с базой данных. Скачайте файл, распакуйте его в каталог 
проекта, добавьте 34114е3.0 в цель објесіѕ своего файла таке е – и вы получите 
полнофункциональный движок базы данных. 

Вам придется иметь дело всего с несколькими функциями: открыть базу дан- 
ных, закрыть базу данных, послать запрос и получить строки данных из базы. 
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Вот как выглядят функции открытия и закрытия базы данных: 


ѕа1іёе3 *ар=М№011; // глобальный описатель базы данных 
іле ар ореп (сһаг *Н1епапе) { 
1Ё (б1епате) 59116е3 ореп (#1епате, &46); 


е1зе 59116 е3_ореп(":метогу:", &4Ъ); 
1Е (!95) ({ргіпё# ("Не удалось открыть базу данных.\п"); гебигп 1;} 
гебогп 0; 


} 


// функция закрытия базы данных совсем проста: 
5911 е3_с1озе (ар); 


Я предпочитаю объявлять ОДИН глобальный описатель базы данных. Если 
нужно открыть несколько баз данных, то можно воспользоваться командой ЗОГ. 
асёасћ. ЗОГ-команды для доступа к таблице в такой присоединенной базе данных 
выглядят примерно так: 
аёбасһ "Ч41зКаафа.аЪ" аз 91$Каь; 


сгеаёе 1п4ех аіѕкар.іпаех1 оп аіѕкар.ёар1 (со11); 
зе1есЕ * Егом аіѕкар.ёар1 мһеге со11=27; 


Если первый описатель относится к базе данных в памяти, а присоединенные 
базы данных находятся на диске, то нужно явно указывать, какие новые таблицы 
и индексы записываются на диск; любой объект, относительно которого нет та- 
ких указаний, будет временной таблицей в памяти – доступ к ней быстрее, но при 
завершении программы она пропадает. Если вы по оплошности создали таблицу 
в памяти, то впоследствии ее можно будет записать на диск командой вида сгеа{е 
бар1е ӣіѕкар.ѕауеа ёар1е аз ѕеІесі * Ғгот бар1е іп тепогу. 


Запросы 


Ниже приведен макрос для отправки базе данных 501 -запроса, не возвращающе- 
го данных. Например, команды аїбасћ и сгеа{е іпіех просят базу выполиить опре- 
деленные действия, но ничего не возвращают. 


#аеѓіпе ЕВВСНЕСК {1Ё (егг!=МОЬЬ) ({ргіпёё ("%5\п",егг); гебигп 0; }} 


#Чейпе чиегу(...) (сһаг *аџегу; аѕргіпе# (&ацегу, _\УА_АВб$__); \ 
сһаг *егг=МоГЬ; \ 
ѕд91іе3 ехес (46, дџегу, МОШЬ, МОБЬ, вегг); \ 
ЕВКСНЕСК \ 


Ғгее (аџегу); Ёгее (егг);} 


Макрос ЕВЕСНЕСК взят непосредственно из руководства по ЗОГ.е. Я обернул 
обращение к 5а11*е3 ехес макросом, чтобы можно было использовать такие кон- 
струкции: 


Еог (іпё 1=0; 1< со1 сі; 1++) 
ацегу ("сгеаЕе 1п4ех ійх%і оп Чака (со1%і) ", і, і); 


Построение строки запросов в стиле ргіпїї — обычное дело при работе с ЗОТ. 
из С. Как правило, большинство запросов в программе строится как раз динами- 
чески. Но у этого подхода есть недостаток: в ЗОГ.-операторе 1іке и в форматной 
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строке рг1п(Ё знак% имеет специальный смысл, поэтому вызов диегу("зе]1есе * 
гот даба мћеге со11 11ке 'р%%ліѕ'") завершится с ошибкой, так как ргіпїї полагает, 
что конструкция%% предназначена для нее. Правильный вариант выглядит так: 
диегу ("%3", "ѕеІесі * Егоп Чака мћеге со11 11ке 'р%%ліѕ'"). Тем не менее динамическое 
построение запросов настолько употребительно, что можно смириться с мелким 
неудобством в виде добавления лишней строки%5 для статических запросов. 

Чтобы получить от 5011ќе данные, необходимо задать функцию обратного вы- 
зова (см. раздел «Функции с обобщенными входными параметрами»). Вот пример 
функции, которая выводит результаты на экран. 
іпЕ Еће са11баск (уоіа *ідпоге ёһіѕ, ілі агдс, сһаг **агду, сһаг **со1итп) { 

Ғог (іп 1=0; 1< агдс; 1++) 

ргіпіё ("%5,\Е", акау[1]); 
ргіпеё ("\п"); 
геигп 0; 


} 


#аеѓіпе чиегу ёо зсгееп(...) { 
сһаг *аџегу; аѕргіпё# (&дџегу, _ \УА_АВС$ _); 
сһаг *егг=М№011; 
5911Ее3 ехес (ар, аџегу, һе са11раск, МО, &егг); 
ЕВВСНЕСК 
Ғгее (аџегу); Егее (егг); } 


АР 


Входные параметры функции обратного вызова напоминают параметры паіп: 
имеется параметр агду – список строк длиной агдс. Имена столбцов (также список 
строк длиной агдс) передаются в параметре соІ0тп. Для вывода на экран как-то 
преобразовывать строки не нужно, так что особых трудностей не возникает. А вот 
как выглядит функция, заполняющая массив: 


суреде { 
аоџр1е *ааќа; 
іп гомѕ, со15; 
} аггау ми ѕіге; 


іп ће са11раск (уоіа *аггау іп, іпё агас, сһаг **агду, сһаг **со1итп) { 
аггау н ѕіге *аггау = `аггау іп; 
*аггау = геа]1ос(&ваггау->аба, $12ео# (аоџЬі1е) * (++ (аггау->гомз) } *агдс); 
аггау->со1ѕ=агдс; 
Ғог (іп 1=0; 1< агдс; 1++) 
аггау->ааѓа [ (аггау->гом$-1) *агдс + і] = аёо (агду[і]); 


} 


#аейпе аџегу бо аггау (а, ...){ 
сһаг *аџегу; азрг1пЕЕ (вацегу, _ ҮА АКС5 ); 
сһаг *егг=№0І1; 
591іёе3 ехес (ар, аџегу, һе са11раск, а, &егг); 
ЕВВСНЕСК 
Егее (аџегу); Егее (егг); } 


р -- 


// пример использования: 
аггау_м_$12е опігиѕімогећу; 
ачегу_Ко_аггау (&ипЕгиѕімогіћу, "з5е1есе * ЁЕгом реор1е мһеге аде >%1", 30); 
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Проблема возникает тогда, когда имеются как строковые, так и числовые дан- 
ные. Код, в котором обрабатывается случай таких смешанных данных, занимает 
в вышеупомянутой библиотеке Арорћепіа одну или две страницы. 

Тем не менее достойно восхищения, что этих двух коротких фрагментов кода 
вкупе с двумя файлами ЗОГЩе и небольшой модификацией строки објесёѕ 
в такеШе достаточно для включения в программу полнофункциональной базы 
данных 801. 


іхті и СОг 


сОВГ - это написанная на С библиотека, поддерживающая длинный список про- 
токолов Интернета, в том числе НТТР, НТТР$, РОРЗ, Тешпе, ЅСР и, конечно, 
СорВег. Если вам понадобится организовать взаимодействие с сервером, то, ско- 
рее всего, ПЬс ИВТ. поможет. Как будет видно из следующего примера, библиотека 
предоставляет простой интерфейс, требующий от программиста задать всего не- 
сколько переменных и затем установить соединение. 

Раз уж мы заговорили об Интернете, где повсеместно употребляются языки 
ХМЕ и НТМІ, уместно будет познакомиться заодно и с библиотекой 1х2. 

Расширяемый язык разметки (ХМГ.) применяется для форматирования прос- 
тых текстовых файлов, но по существу он определяет древовидную структуру. 
В верхней части рис. 13.1 показан фрагмент данных в формате ХМГ, в котором 
практически невозможно разобраться; в нижней половине те же данные представ- 


<Боок> <їе>Тће Соідеп Воџдһ</е> 
<‹арќег> <е>Тһе Ктд оЁ(һеМоой</1е> 
<раг>МНО доеѕ по! Кпом Тигпег'ѕ рісќиге оЁ (ће бо!Феп Воџдћ?</раг> 
<раг>!п ап дийу (ћіѕ ѕуІмап |апдзсаре маѕ {ће ѕсепе оға 
5ігапде апд гесиггіпо {гадеду.</раг></сһарќег> 
<сһарќег> <їе>Ргіеѕйу Кіпдѕ</1е> <раг>...</раг> 
</сһарќег> </Боок> 


= Е 
ЕЕЕ ЕЕ 


Рис. 13.1 *% ХМІ -документ и представляющее его дерево 
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лены в виде дерева. Работать с подробно размеченным деревом сравнительно прос- 
то: можно начать с корневого узла (возвращаемого функцией хп1росбеЕКооЁЕІетепї) 
и рекурсивно обойти все элементы. Или получить все элементы с тегом раг. Или 
все элементы с тегом {1 1е, являющиеся потомками второй главы. И так далее. 
В следующем примере путь //ісеп/єі1е отбирает все элементы (11е с родителем 
(ет, где бы они ни находились в дереве. 

Таким образом, библиотека ПЬхп2 говорит на языке размеченных деревьев, 
а объектами в ней являются представления документа, узлы и списки узлов. 

В примере 13.5 приведен полный пример. Я документировал его с помощью 
Рохувеп (см. раздел «Встроенная документация»), потому он и оказался таким 
длинным, зато код сам объясняет себя. Если вы обычно пропускаете длинные кус- 
ки кода, попробуйте все-таки задержаться и оценить, насколько эта программа по- 
нятна. Если у вас под рукой есть Оохувеп, можете сгенерировать документацию и 
ознакомиться с ней в браузере. 


Пример 13.5 % Разбор ленты новостей газеты «Нью-Йорк таймс» 
и преобразование ее в более простой формат (пу! їееа.с) 
/** Эе 


Программа чтения ленты главных новостей Нью-Йорк таймс и создания 
более простой НТМЬ-страницы. */ 

#1пс1и4е <5&41о.1в> 

#1пс1и4е <сог1/сиг1.һ> 

#іпс1џае <11рхт12/1ірхт1/храёћ.һ> 

#іпс10одӢе "ѕіоріё.һ" 


/** \та1праде 

Начальная страница сайта газеты Нью-Йорк таймс, выполненная в кричащем 
стиле, содержит несколько главных новостей и разделов в попытке завладеть 
вниманием читателя. Присутствуют различные схемы форматирования и даже 
фотографии -- <ет>цветные</ет>. 


Эта программа читает новостную К55-ленту газеты и формирует простой список 
в формате НТМЬ. Затем вы можете щелкнуть по заинтересовавшей вас ссылке. 


Замечания о компиляции см. на странице \геЁ компиляция. 
*/ 


/** \раде компиляция Компиляция программы 
Сохраните следующий код в \с маКеШе. 


Обратите внимание, что в состав СОВЬ входит программа \с сиг1-сопйд, 
которая ведет себя как \с рка-сопіід, но с учетом специфики с0ОКІ. 


\соде 

СЕТАСЅ =-9 -Ма11 -03 `сиг1-сопіід --сһђадѕ` -І/оѕг/іпс1џйе/1ірхт12 
Ір1Вѕ$= `сиг1-сопіёіў --11рѕ ` -1хт12 -1Ірёһгеаа 

СС=с99 


пуЕ_Еееа: 
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\епасоде 
Сохранив макей1е, выполните команду <Е{>таке пу _{ее4</*&> для компиляции. 


Разумеется, должны быть установлены пакеты разработчика для 11Ъсиг]1 и 
116хп12. 
*/ 


// В код встроена документация в формате Оохудеп. Символ < указывает на 
// предыдущий документируемый текст. 
сһаг *г$$_иг1 = "Һер: //055. пусітеѕ.сот/ѕегуісеѕ/хт1 /г55/пус/НотеРаде.хт1"; 
/**< ОВЬ В55-ленты МУТ. */ 
сһаг *г$3Н1е = "пуёітеѕ Ғеейѕ.гѕ5"; 
/**< Локальный файл, в который пишется К55-лента.* / 
"пои. Вет"; 
/**< выходной файл, открываемый в браузере. */ 


сһаг *ооєй1е 


/** Вывести список главных новостей в формате НТМІ в оџбй1е, затирая 
предыдущий вариант. 
\рагам иг1$ Список џг1-адресов. Должен быть отличен от МОШЬ. 
\рагам +1{1ез Список заголовков, также должен быть отличен от МО. Если 
длина списка \с џг1ѕ или списка \с &11е$ равна \с МОЬЬ, программа 
грохнется. 
*/ 
уоіа ргіпе ёо ћет1 (хт1ХРаћорјесЕРЄг иг15$, хт1ХРаЕПОБ]есЕРЕг &141е$) { 
ЕПЕ *# = Ғ#ореп (оџёй1е, "м"); 
Ғог (іп 1=0; 1< ёіб1еѕ->пойеѕеёуа1->пойеМћг; і++) 
ҒргіпёЁ (Ё, "<а һгеЁ=\"%5\">%5</а><рг>\п" 
‚ хп1МодебеЕСопёепі (иг]1$->подезееуа1->поадеТаь [1] 
‚ хи]МодебееСопЕепе ({1{1е5->подезееуа1->по4еТаь[1])); 
Ес1озе (#); 
} 


/** Разобрать К55-ленту на диске. Функция разбирает ХМІ, затем находит все 
узлы, удовлетворяющие выражению ХРаеН для элементов заголовков, и все узлы, 
удовлетворяющие выражению ХРа®Н для элементов ссылок. Эти узлы далее 
записываются в ое. 


\рагам 1пЙ1е Файл, содержащий К55-ленту. 

*/ 

іп рагзе (сһаг соп$е *іпѓі1е) { 
сопзЕ хм1Сраг *ёіё1ераёћһ= (хт1Сһаг*) "//ібет/ёіб1е"; 
сопзЕ хм1Спаг *1іпкраёћ= (хт1Сһаг*) "//ібет/1іпк"; 


хт1росРЄг дос = хп1РагзеЕ11е (1п#1е); 
ЗЕор1Ё (!4ос, геёогп -1, "Ошибка при разборе файла \"%5\"\п", 1пе); 


хп] ХРа ВСопеехЕРЕг сопёехі = хт1 ХРаҺМемСопбехі (дос); 
ЗЕор1Ё (!сопёехі, гебигп -2, "Ошибка при создании контекста ХРаёћ\п"); 


хп] ХРа*пОБ)есЕРЕг +141ез = хп]1ХРа®ПЕуа1Ехрге$$1опт (+1{1ераёП, сопбехі); 

хп] ХРа ВОБ)есЕРЕг иг1$ = хм]1ХРа®ПЕуа1Ехрге$$1опт (11пкраёН, сопбехі); 

$6 ор1Ё (!11Е1ез || !0г1ѕ, гебигп -3, "ошибка в Храёћ '//іёсет/біс1е!' " 
"или в '//ібет/1іпк'."); 


Глава 13. Библиотеки % 337 


рг1пЕ бо Һм (иг1ѕ, біб1еѕ); 


хт1ХРаєҺЕгееоЬјесї (іб1еѕ); 
хт1ХРаћЕгееОбјесії (иг1$); 
хп1ХРаєҺЕгееСопбехі (сопбехі) ; 
хп1Егеерос (аос); 


геёогп 0; 


/** Используем простой интерфейс СОВЬ для скачивания В55-ленты. 
\рагат иг1 ОВЬ В5$5-ленты Нью-Йорк таймс. Все адреса, перечисленные в 
\иг1 ВЕЕр://мии. пу 1тез .сом/зегу1сез/хт]1/гз$/пуе/, должны 
работать. 
\рагат оџёйІе Файл главных новостей, в который производится запись. Сначала 
в этом файле сохраняется В55-лента, а затем вместо нее записывается короткий 
список ссылок. 
\гебигп 1==ОК, 0==ошибка. 
*/ 
116 дес _гѕѕ (сһаг сопхі *0г1, сһаг сопѕі *оџёй1е) { 
ЕТЬЕ *ЕеедН]1е = Ғореп (ое, "м"); 
1Е (!Ғееаі1е) геёогп -1; 


СОК *сиг1 = сиг1 еаѕу іпіє(); 

1Е(!сиг1) гебагп -1; 

сиг1 еазу_зеор*(сиг1, СОВЬОРТ_ОВЬ, иг1); 

сиг] еаѕу ѕеборі (сиг1, СОВІОРТ ИВІТЕРАТА, Еееа#1е); 
СОВІсоде геѕ = сиг1 еазу_регЁогт(сиг1); 

1Е (гез) гебигп -1; 


сиг] еазу_с1еапур (сиг1); 
Ёс1оѕе (Ғеейћ1е); 
геёогп 0; 


іп тмаіп (уоіа) { 
ЗЕор1Е (деї гѕѕ (гѕѕ игі, гѕѕіі1е), гебигп 1, 
"не удалось скачать$ѕ в%ѕ.\п", 
рѕѕ игі, гѕѕћ1е); 
рагзе (гѕѕћ1е); 
ргіпі# ("Главные новсти записаны в%ѕ. Откройте этот файл в браузере. \п", 
ооёй1е) ; 


Эпилог 


Зажги новую спичку, начни спачала. 
— Боб Дилан 

па закрытии фестиваля 
фолк-музыки 1965 года в Ньюпорте, 
песия «10 АЙ Оуег Мож Вау Вс» 


«Но постой-ка! — слышу я возгласы. – Ты же обещал, что я смогу использовать 
библиотеки, чтобы облегчить себе работу. Но я – специалист в своей области – ис- 
кал повсюду, но так и не нашел библиотеки, которая мне нужна!» 

Если это вы сетовали, то самое время раскрыть секретную цель, которую я пре- 
следовал при написании этой книги: будучи пользователем С, я хочу, чтобы как 
можно больше людей писали библиотеки, которыми я смог бы воспользоваться. 
Если вы дочитали до этого места, то знаете, как писать современный код, в ко- 
тором используются библиотеки, как создать набор функций, предоставляющих 
интерфейс к простому объекту, как сделать удобный интерфейс, как документи- 
ровать свой код, чтобы другие могли его использовать, какие имеются средства 
тестирования, как работать с репозиторием Сі, чтобы ваши соавторы могли внес- 
ти свой вклад, и как собрать код в пакет для пользователей, имеющих Ашбобоо[5. 
С — основа современных вычислений, поэтому если вы оформите решение задачи 
в виде кода на С, но оно будет доступно на самых разных платформах. 

Панк-рок – это вид искусства «сделай сам». Общепризнано, что музыка пишет- 
ся такими же людьми, как мы, и что не требуется специального разрешения от 
какого-то наблюдательного комитета для создания и распространения своих тво- 
рений во всем мире. И у нас есть инструменты, позволяющие это делать. 


Приложение 
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Основные свеления 
о языке С 


В этом приложении рассматриваются основы языка. Оно предназначено не для 
всех. 

О Если у вас уже есть опыт программирования на каком-нибудь распростра- 
ненном скриптовом языке, например Ру(ћоп, Киђу или Уіѕиа! Ваѕіс, то это 
приложение как раз для вас. Я не собираюсь объяснять, что такое перемен- 
ные, функции, циклы и прочие базовые конструкции, поэтому сами назва- 
ния разделов сообщают о существенных различиях между С и типичными 
скриптовыми языками. 

О Если вы изучали С давно и успели изрядно подзабыть, то беглый просмотр 
этого приложения поможет вспомнить тонкости, отличающие С от других 
языков. 

О Если вы работаете с С постоянно, то не тратьте времени на это приложение. 
Быть может, даже первые главы части П стоит пропустить или проглядеть 
лишь мельком, поскольку они посвящены типичным ошибкам и недопони- 
манию базовых основ языка. 

Не думайте, что, прочитав это пособие, вы станете экспертом по С, - не сущест- 

вует никакой замены практическому опыту работы. Но вы все же сможете присту- 
пить к чтению части П и разобраться в нюансах и полезных обычаях языка. 


Я начну руководство так же, как это сделали Керниган и Ричи в своей знаменитой 
книге 1978 года: с программы, которая здоровается с миром. 


//еобогіа1/ће110о.с 
#1пс1и4е <5ѕаіо.һ> 


116 таіп() { 
ргіпеЁ ("Не110, мог1а.\п"); 


Два знака косой черты в первой строке обозначают комментарий, игнорируе- 
мый компилятором. Все примеры кода в этом приложении, в начале которых 
указано имя файла, можно скачать с сайта ћрѕ: / /ріћиЬ.сот/ЂЪ-К/215#-Сепёигу- 
Ехатріезѕ. 

Даже этот крохотный фрагмент многое говорит о языке С. С точки зрения 
структуры, в программе на С можно выделить следующие элементы: 
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О директива препроцессора, например #ілсІоде <5Ёадіо.ћ>; 
О объявление переменной или типа (в этой программе нет ни того, ни дру- 
гого); 
О блок функции, например паіл, содержащий выражения, подлежащие вычис- 
лению (например, ргіпі#). 
Но прежде чем переходить к деталям определения и использования директив 
препроцессора, объявлений, блоков и выражений, нужно понять, как эту програм- 
му запустить, чтобы компьютер мог нас поприветствовать. 


В С необходим этап компиляции, состоящий из одной 
команды 


Скриптовый язык подразумевает наличие программы, которая интерпретирует 
текст скрипта; для С имеется компилятор, который принимает исходный текст 
программы и порождает файл, исполняемый непосредственно операционной си- 
стемой. 

Если на вашей машине нет компилятора, прочитайте раздел «Работа с менедже- 
ром пакетов», где описано, как его добыть. Короткий совет: попросите менеджер 
пакетов установить рсс или сапе и таке. 

Итак, допустим, что компилятор и таке установлены. Если вы сохранили при- 
веденную выше программу в файле ће110.с, то, для того чтобы заставить таке за- 
пустить компилятор, достаточно такой команды: 


таке Ве11о 


В результате будет создан файлћһе110, который можно выполнить из командной 
строке или щелкнув по нему в файловом менеджере. Сделайте это и убедитесь, что 
печатается именно то, что ожидается. 

В репозитории исходного кода имеется файл таке е, который содержит ин- 
струкции для паке: какие задавать флаги компилятора. Принципы работы таке и 
содержание таке е подробно обсуждаются в разделе «Работа с файлами таке- 
Не». А пока я упомяну только один флаг: -Ма11. Он просит компилятор выводить 
все предупреждения о тех местах в коде, которые технически правильны, но, воз- 
можно, будут работать не так, как вы хотели. Эта техника называется статиче- 
ским анализом, современные компиляторы владеют ей прекрасно. Таким образом, 
можно считать, что шаг компиляции - не просто бесполезная формальность, но 
еще и шанс перед запуском предложить свой код на рассмотрение команде веду- 
щих мировых экспертов по С. 

Если вы работаете с компилятором на платформе Мас, который не понимает 
флага -Ма11, прочитайте в разделе «Несколько моих любимых флагов» замечание 
о том, как создать псевдоним для 9сс. 

Многие блогеры считают шаг компиляции обузой. Но если вы пользуетесь ин- 
тегрированной средой разработки (ТШОЕ), то почти наверняка в ней есть кнопка 
«Откомпилировать и выполнить». Если вы считаете, что набрать таке уоџгргодгат 
в командной строке перед запуском . /уоџгргодгат — непосильный труд, то можете 
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написать псевдоним или скрипт оболочки. В совместимой с РОЅІХ оболочке мож- 
но было бы определить функцию: 


Еопсёіоп скип { таке $1 && ./51; } 


и использовать ее следующим образом: 


сгип Ве11о 


При этом будет произведена попытка компиляции, и если она пройдет успешно, 
то программа будет запущена. 


Существует стандартная библиотека, это часть операционной 
системы 


Современные программы редко бывают совсем автономными, чаще они компо- 
нуются с библиотеками общих функций, которые, возможно, используются во 
многих программах. Путь к библиотекам - это список каталогов на диске, в кото- 
рых компилятор ищет библиотеки, подробнее см. раздел «Пути» в главе 1. Самой 
главной среди всех библиотек является стандартная библиотека, определенная 
в стандарте 1850 С. Она настолько близка к универсальной доступности, насколь- 
ко это вообще возможно для компьютерного кода. Именно в ней находится функ- 
ция ре1пЕЕ. 


Существует препроцессор 

Библиотеки хранятся в двоичном формате, они исполняются компьютером, но 
для человека представляют бессмысленный набор байтов. Если вы не обладаете 
сверхъестественной способностью читать двоичные файлы, то, глядя на откомпи- 
лированную библиотеку, не сможете понять, правильно ли вы используете функ- 
цию ргіпіё. Поэтому в дополнение к библиотеке имеются файлы-заголовки, содер- 
жащие текстовые объявления реализованных в библиотеке средств, а именно: для 
каждой функции приводятся описания ожидаемых входных параметров и возвра- 
щаемых значений. Если вы включите в свою программу подходящий заголовок, 
то компилятор сможет проверить совместимость использования всех функций, 
переменных и типов с тем, что ожидает библиотека. 

Основная задача препроцессора заключается в том, чтобы заменять текст, за- 
данный в директивах препроцессора (все они начинаются знаком #), другим тек- 
стом. Существует много иных применений (см. раздел «Приемы работы с пре- 
процессором» в главе 8), но в этом приложении я ограничусь только включением 
файлов. Видя директиву 


#іпс1џае <5&41о.1> 


препроцессор подставляет вместо нее полный текст файла 1910.1. Угловые скоб- 
ки в <5{910.1>, говорят, что файл нужно искать на пути включения (это не то же 
самое, что путь к библиотекам, см. раздел «Пути» в главе 1). Если файл находится 
в рабочем каталоге проекта, то нужно использовать форму #1пс1де "пућ1е.ћ". 
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Суффикс .ћ в имени файла означает, что это заголовок. Заголовки содержат 
обычный текст, и компилятор не отличает их от других файлов с кодом, но при- 
нято помещать объявления именно в заголовки. 

После завершения работы препроцессора почти все в коде оказывается либо 
объявлением переменной или типа, либо определением функции. 


Существуют комментарии двух видов 


/* Многострочный комментарий заключен между комбинациями символов 
косая черта-звездочка и звездочка-косая черта. */ 

// Однострочный комментарий начинается после двух символов косой черты 
// и продолжается до конца строки. 


Нет ключевого слова ргіпї 


Функция ргіпі# из стандартной библиотеки выводит текст на экран. У нее есть 
собственный мини-язык для точного указания, как должны печататься перемен- 
ные. Не буду вдаваться в детальные объяснения, потому что исчерпывающие 
описания языка форматирования, применяемого в ргіпёѓ, можно найти в других 
местах (попробуйте набрать команду пап 3 ргіпїѓ), да к тому же примеров доста- 
точно как в этом руководстве, так и в основном тексте книги. Предложение на этом 
мини-языке состоит из обычного текста, в котором встречаются маркеры подста- 
новки переменных и специальные коды для символов, не имеющих графического 
начертания, например знаков табуляции и перехода на новую строку. Ниже пере- 
числены шесть элементов, которые попадаются в примерах использования функ- 
ций из семейства рг1пЕЁ: 
\п переход на новую строку; 


\  табулятор; 
і вставить целое значение; 
9 вставить вещественное значение в общем формате; 


[9] 


вставить строку текста; 
вставить один знак процента. 


Хо о Оо оо 


оо 


Объявления переменных 


Объявления в С и в большинстве скриптовых языков существенно отличаются 
тем, что в скриптовых языках тип переменной и даже сам факт ее существования 
устанавливаются при первом использовании. Выше я уже говорил о том, что этап 
компиляции дает возможность еще до выполнения проверить, чтокодхотя бы тео- 
ретически будет делать то, что обещано; объявление типа любой переменной по- 
зволяет компилятору удостовериться, что код непротиворечив. Существует также 
синтаксис объявления функций и новых типов. 


Любая переменная должна быть объявлена 


В программе ће110 переменных не было, но ниже приведена программа, в которой 
объявляется несколько переменных и демонстрируется использование ргіпёѓ. Об- 
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ратите внимание на первый аргумент рг1п{{ (форматную строку); в ней имеются 
три подстановочных маркера (спецификаторы формата), поэтому далее следуют 
три переменные, подставляемые вместо маркеров. 


//обогіа1/ёеп рі.с 
#іпс1і0цае <56аіо.һ> 


106 таіп () { 
аӢоџр1е рі= 3.14159265; // кстати, в РОЅІХ определена константа М РІ 
// в файле таёһћ.һ 
116 соцпе= 10; 
ргіпёЁ ("%9 *%1 =%9.\п", рі, соипё, рі*сооџпё); 


Эта программа выводит: 
3.14159 * 10 = 31.4159. 


В этой книге встречаются три базовых типа: іпі, йоџр]е и саг, соответственно, 
целое число, число с плавающей точкой двойной точности и символ. 

Некоторые блогеры считают, что необходимость объявлять переменные – 
участь хуже смерти, но, как видно из примера, весь труд сводится к добавлению 
имени типа до первого использования переменной. А при чтении незнакомого 
кода наличие типа каждой переменной и признака первого использования - не- 
плохие ориентиры. 

Если есть несколько переменных одного типа, то их можно объявить в одной 
строке: 


іп соопі=10, соџпё2, соип3=30; // соџпё2 не инициализирована. 


Даже функции необходимо объявлять или определять 


В определении функции описывается все, что она делает, как, например, в следую- 
щем тривиальном примере: 
11Е ааа мо іпіѕ (іле а, іле Ы) { 


геёогп а+Ъ; 


} 


Эта функция принимает два целых числа, которые внутри функции называют- 
сяаиь, и возвращает одно целое число — сумму аир. 

Можно вынести объявление в отдельное предложение, в котором указываются 
имя функции, типы входных параметров (в скобках) и тип возвращаемого значе- 
ния: 


1пЕ ааа ёмо іпеѕ (іпё а, іпё Ы); 


Здесь не сказано, что в действительности делает функция айі іко іпїѕ, но и та- 
кого объявления компилятору достаточно, чтобы проверить правильность всех 
случаев употребления функции: что ей передается два целых числа и что резуль- 
татом является тоже целое. Объявление функции, как и любое другое, может на- 
ходиться прямо в файле с кодом или в файле-заголовке, который включается ди- 
рективой вида #1пс104е "тудесІагаёіопѕ.ћ". 
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Блоком называется участок кода, заключенный в фигурные скобки. Следова- 
тельно, определение функции представляет собой объявление, за которым следу- 
ет один блок, исполняемый при вызове функции. 

Если полное определение функции предшествует ее первому использованию, 
то у компилятора есть все необходимое для проверки корректности, и отдельное 
объявление излишне. Поэтому программы на С чаще всего пишутся и читаются 
«снизу вверх», то есть функция па1п оказывается последней в файле, после опре- 
деления всех функций, вызываемых из паіп, а перед этими функциями находятся 
определения тех, которые вызываются из них, и т. д. до заголовков в начале файла, 
где объявлены все используемые библиотечные функции. 

Кстати говоря, функция может иметь тип уоій, означающий, что она не возвра- 
щает ничего. Это полезно в случае функций, которые ничего не возвращают и не 
изменяют входных параметров, но имеют побочные эффекты. Например, ниже 
приведена программа, состоящая в основном из функции, которая выводит в файл 
(он будет создан на диске) сообщения об ошибках в фиксированном формате. Тип 
РШЕ и все сопутствующие ему функции объявлены в заголовке ѕїйіо.ћ Почему 
строка текста объявлена в виде переменной типа сћаг*, я объясню ниже. 


//Еиког1а1/еггог_рг1пе.с 
#1пс1а4е <$Еа1о.Н> 


уоіа еггог ргіпё (ЕТЬЕ *еЁ, 1пЕ еггог_со4е, сһаг *тз9) { 
Ерг1пЕЁ (её, "Произошла ошибка #%1:%5.\п", еггог соде, тз9); 


} 


106 таіп () { 
ЕТЬЕ *еггог Н]е = Еореп("ехаптр1е_еггог_Н1е", "м"); //открыть для записи 
еггог ргіпё (еггог #1е, 37, "Вся карма вышла"); 


} 


Базовые типы можно агрегировать в массивы и структуры 


Как работать, имея только три базовых типа? Путем создания составных типов: 
массивов, содержащих элементы одного и того же типа, и структур, содержащих 
элементы разных типов. 

В следующей программе объявляются список из десяти целых чисел и строка из 
20 символов, после чего используются части того и другого. 


//еџсогіа1/ібет ѕеуеп.с 
#1пс1и4е <ѕ6аіо.һ> 


іпе іпё1150([10]; 


іп таіп() { 
116 1еп=20; 
сһаг ѕёгіпо [1еп]; 


іпё11іѕЕ [7] = 7; 
ѕпргіпеЁ (ѕёгіпд, 20, "Элемент 7 равен%1.", 1п%11$%[7]); 
ргіпёЁ ("строка содержит: <<%5>>\п", 3зёг1п9); 


ө, 
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Функция ѕпргіпї выводит в строку не более указанного количества символов, 
синтаксис форматной строки такой же, как у функции ргіпѓё. Подробнее о работе 
со строками и о том, почему переменную 114115 можно объявить вне функции, 
а переменная ѕігіпд должна быть объявлена внутри, я расскажу ниже. 

Индекс – это смещение от начала массива. Первый элемент находится в самом 
начале массива, поэтому обозначается іпі115ї [0]; последним элементом массива 
из десяти элементов будет 111151 [9]. Это еще одна причина паники и ожесточен- 
ных перепалок в Сети, но у этого соглашения есть смысл. 

У некоторых композиторов есть нулевые симфонии (Брукнер, Шнитке). Но, 
как правило, мы пользуемся порядковыми числительными - первый, второй, седь- 
мой, и это вступает в противоречие со схемой нумерации по смещению: седьмой 
элемент массива обозначается іпі115ї [6]. Поэтому я стараюсь пользоваться дру- 
гой языковой конструкцией: элемент 6 массива. 

По причинам, которые станут ясны позже, тип массива можно обозначать также 
звездочкой: 


іпе *іпё1156; 


Пример вы уже видели выше, при объявлении последовательности символов 
в виде сраг *159. 


Можно определять новые структурные типы 


Данные разных типов можно объединить в структуру (обозначается ключевым 
словом ѕёгисї) и рассматривать как единое целое. В примере ниже объявляется и 
используется тип га{1о_$, описывающий дробь, которая имеет числитель, знаме- 
натель и десятичное значение. Псевдоним типа – (урееѓ – это по существу список 
объявлений в фигурных скобках. 

При работе со структурами бросается в глаза изобилие точек: если данаструкту- 
ра г типа гаїіо 5, то хранящийся в ней числитель обозначается г.попегаїог. Выра- 
жение (ӣоџЬ1е) деп – это приведение типа, в результате которого целая переменная 
деп преобразуется в тип йоџр1е (зачем это нужно, объясняется ниже). Синтаксис 
инициализации новой структуры выглядит как приведение типа: сначала идет за- 
ключенное в круглые скобки имя структурного типа, а затем начинающиеся с точ- 
ки элементы этого типа, заключенные в фигурные скобки. Существуют и более 
краткие (и оттого менее понятные) способы инициализации структуры. 


//еосогіа1/габіо 5.с 
#1пс1и4е <ѕбаіо.һ> 


СуредеЁ ѕігисі { 
іп потегаіог, депотіпабог; 
аоџр1е уаіџе; 

} габіо з; 


гаііо ѕ пем габіо (іп пит, 1п6 аеп) { 
гебогп (габіо 5ѕ) {.питегаіог=пит, .депотіпаёог=еп, 
.ма1ое=пит/ (аоџЬ1е) деп }; 
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уоіа ргіпе габіо(габіо з г) { 
ргіпіЁ ("%1/%1 =%9\п", г.пимегаеог, г.ӣепотіпаёог, г.уа1џе); 


} 


гае1о_5 габіо ааа (гасіо 5 Іеї, габіо ѕ гічћб) { 
гебогп (габіо 5) { 
.пимегаког=1еЁе. потегасог* гідћё .депотіпаёог 
+ гідһе. потегасог* её .дӢепотіпаќог, 
.аепотіпаёог=1ІеЁё .депотіпаёог * гідћһі .Яепотіпаог, 
.Уа1ие=1еЁе.уа]ие + гідһћё.уа1џе 
}; 
} 


іп таіп() { 
габіо 5 ёмобћігӣѕ= пем габіо (2, 3); 
габіо ѕ ачиагеег= пем габіо (1, 4); 
ргіпі габіо (Емоёћігаѕ); 
ргіпі гаѓіо (адџагѓег); 
ргіпі габіо (гаііо ада (смосћһігаѕ, адиагеег)); 


} 


Можно узнать размер типа 


Оператор $12е0 принимает имя типа и сообщает, сколько памяти будет занимать 
экземпляр этого типа. Иногда это удобно. 

Следующая короткая программа сравнивает размеры двух 11 и доче с разме- 
ром определенного выше типа га{1о_5. Спецификатор формата%?и в форматной 
строке ргіпё# предназначен исключительно для печати результата $12е0#. 


//еобогіа1/ ѕігеоЁ.с 
#іпс10џае <56діо.һ> 


фуредеЁ ѕёгисё { 
іпё потегаёог, епотіпабог; 
аоџр1е уа11е; 

} габіо 5; 


іп ма1пт() { 
ргіпіЁ ("размер двух іп: %20\п", 2*5ігеоЁ (іпё)); 
ргіпёЁ ("размер двух іпе: %20\п", $12е0Е (іп [2])); 
ргіпё# ("размер Ядоџр1е: %20\п", 312еоЁ (аоџр1е)); 
ргіпёё ("размер структуры гасіо 5: %20\п", $12е0# (габіо 5)); 


} 


Не существует специального типа строки 


Оба целых числа, 5100 и 51, занимают $12е0# (іпі) байтов в памяти. Но строки 
"Ні" и "Не110" содержат разное число символов. В скриптовых языках обычно су- 
ществует специальный тип строки, рассчитанный на управление списками сим- 
волов неопределенной длины. В С строка - это массив элементов типа сћаг, ясно 
и просто. 
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Конец строки обозначается символом М, имеющим значение '\0', хотя он 
никогда не печатается; заботу о нем обычно берут на себя библиотечные функ- 
ции. (Отметим, что символы заключаются в одиночные кавычки, например 'х', 
а строки - в двойные кавычки, например "хх"; строка из одного символа также 
заключается в двойные кавычки - "х"). Функция зіг1еп (пуѕёгіпд) подсчитывает 
количество символов до нуля, не включая последнего. Но эта величина вовсе не- 
обязательно равна объему памяти, выделенной для строки; никто не мешает объ- 
явить сһаг рапіѕ [1000] = "Егоизегз", хотя при этом 991 байт после нуля оказывается 
потрачен впустую. 

Сама природа строк делает возможными кое-какие забавные трюки. Если есть 
объявление 


сһаг* ѕіг="Не110"; 


то строку Нео можно превратить в Не, вставив символ МОТ: 
зір [4] = '\0'; 


Но обычно работа со строками сводится к вызову той или иной библиотечной 
функции, которая манипулирует байтами. Вот несколько наиболее распростра- 
ненных: 

#іпс1џаӣе <ѕгіпд.һ> 

сһаг *51г1 = "һе110", $%г2 [100]; 

ѕёг1еп (5р1); // получить длину строки без учета '\0' 

ѕігпсру (562, 100, ѕіг1); // скопировать не более 100 байтов из $&г1 в $62 
зЕгпсае (5р2, 100, ѕёг1); // добавить не более 100 байтов из ѕіг1 в конец ѕіг2 
ѕігстр (36:1, 5602); // ѕег1 и ѕЕг2 одинаковы? 

ѕпргіпёЁ (5612, 100, "ѕёг1 содержит:%5", ѕіг1); // вывести в строку, как выше 


В главе 9 обсуждается еще несколько функций, облегчающих работу со стро- 
ками. При наличии качественных функций эта деятельность может снова стать 
приятной. 


Функиии и выражения 


Правила видимости в С очень просты 


Область видимости переменной - это та часть программы, в которой ее можно 
использовать. 

Если переменная объявлена вне функции, то ее можно использовать в любом 
выражении от точки объявления до конца файла. Эта переменная доступна любой 
определенной в файле функции. Такие переменные инициализируются в начале 
работы программы и существуют вплоть до ее завершения. Они называются ста- 
тическими, наверное, потому что занимают одно и то же место в памяти в течение 
всего времени работы программы. 

Если переменная объявлена внутри блока (в том числе блока, содержащего 
определение функции), то она создается в точке объявления и уничтожается по 
достижении фигурной скобки, закрывающей этот блок. 
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Дополнительные замечания о статических переменных, в том числе о том, как 
получить переменную с постоянным временем жизни, видимую только внутри од- 
ной функции, см. в разделе «Переменные для хранения постоянного состояния» 
в главе 6. 


Функция таіп имеет особый смысл 


Первое, что делается после запуска программы, – инициализация глобальных 
переменных с областью видимости файла (см. выше). Пока еще никакие матема- 
тические вычисления невозможны, поэтому таким переменным можно присвоить 
либо константное значение (если объявление имеет вид ілі ду=24;), либо значение 
нуль по умолчанию (в случае объявления вида ілі ду;). 

В скриптовых языках обычно некоторые предложения находятся внутри функ- 
ций, а некоторые - в основном теле скрипта, вне любой функции. В С любое вы- 
числяемое выражение должно находиться в теле какой-то функции, а точкой вхо- 
да в программу, где начинаются вычисления, является функция паіп. В примере 
функции зпргіпё# выше массив длиной 1еп должен был находиться внутри паіп, 
потому что получение значения 1еп — слишком сложное действие для этапа ини- 
циализации программы. 

Поскольку функция па1п вызывается операционной системой, она должна быть 
объявлена одним из двух допустимых способов: 
іп таіп (уоіа); 


// или, что то же самое 
іп таіп(); 


либо 


іп ма1п (іп, сһаг**) 
// и эти аргументы принято называть следующим образом: 
116 таіп (іп агдс, сһаг** агду) 


Примеры первого рода, когда ничего не подается на вход и возвращается одно 
целое число, мы уже видели. Это число интерпретируется как код ошибки: счита- 
ется, что программа завершилась успешно, если код равен 0, и с ошибкой - в лю- 
бом другом случае. Этот обычай укоренился настолько прочно, что в стандарте 
С даже говорится о том, что наличие предложения геїигп 0; в конце паіп неявно 
подразумевается (см. раздел «Ни к чему явно возвращать значение из таіп» в гла- 
ве 7). Простой случай объявления второго рода имеется в примере 8.6. 


Большая часть работы программы на С сводится 
к вычислению выражений 


Итак, глобальные переменные инициализированы, операционная система подго- 
товила аргументы для паіп, и программа приступает к выполнению кода в блоке 
функции паіп. 

Начиная с этого момента, все ее действия ограничиваются объявлением локаль- 
ных переменных, управлением потоком выполнения (ветвление в предложении 
і -еІѕе, выполнение итераций цикла) и вычислением выражений. 
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Возвращаясь к приведенному ранее примеру, предположим, что система долж- 
на выполнить следующие предложения: 
іпЕ а1, Емо Сітеѕ; 
а1 = (2+3) *7; 
мо ёітеѕ = ада ёмо іпіѕ (а1, а1); 


После объявлений идет строка а1= (2+3) *7, где требуется сначала вычислить вы- 
ражение (2+3), вместо которого можно подставить его значение 5, а затем вычис- 
лить выражение 5*7, которое можно заменить значением 35. Именно так поступа- 
ют люди, сталкиваясь с подобным выражением, но С идет по пути «вычисления и 
подстановки» гораздо дальше. 

При вычислении выражения а1=35 происходят две вещи. Первая – замена вы- 
ражения его значением: 35. Вторая – побочный эффект, заключающийся в изме- 
нении состояния: значение переменной а1 изменяется на 35. Существуют языки, 
стремящиеся к вычислениям без побочных эффектов, в них единственный резуль- 
тат вычисления — замена одного выражения другим. Но в С разрешены побоч- 
пые эффекты вычислений, выражающиеся в изменении состояния. Еще с одним 
примером мы уже встречались неоднократно: при вычислении ргіпё# ("Ве11о\п") 
выражение заменяется нулем в случае успеха, ноу него есть и побочный эффект: 
изменение изображения на экране. 

После выполнения всех подстановок строка принимает вид 35;. Когда больше 
вычислять нечего, система переходит к следующей строке. 


При вычислении функций используются копии входных аргументов 


В строке ко ітеѕ = айі {мо іпёѕ (а1, а1) требуется сначала дважды вычислить а1, 
затем вычислить результат функции айі ёко іпёѕ с двумя ранее вычисленными ар- 
гументами, 35 и 35. Для этого функции передается копия значения а1, а не само а1. 
Это означает, что никаким способом функция не может изменить значение самой 
переменной а1. Если в коде функции встречаются предложения, модифицирую- 
щие входной аргумент, то надо понимать, что в действительности модифицирует- 
ся не сам аргумент, а его копия. Что делать, если все-таки необходимо изменить 
переданные функции переменные, мы обсудим ниже. 


Выражения заканчиваются точкой с запятой 
Да, вС каждое выражение должно заканчиваться точкой с запятой. С точки зре- 
ния стиля, это спорное решение, зато оно позволяет размещать переходы на новую 


строку, дополнительные пробелы и знаки табуляции всюду, где это способствует 
повышения удобочитаемости программы. 


Есть много сокращенных способов записи арифметических 
операций 
В Сесть ряд удобных сокращенных способов выразить операцию изменения пере- 


менной. Выражения х=х+3 и х=х/3 можно сократить соответственно до х+=3 и х/=3. 
Увеличение переменной на единицу - настолько частая операция, что предложено 
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даже два ее варианта. У обоих выражений х++ и ++х имеется один и тот же побоч- 
ный эффект: увеличение х на единицу (инкремент), но при вычислении х++ выра- 
жение заменяется значением х до инкремента, а при вычислении ++х — значением 
х после инкремента, то есть значением х+1. 


х++; // инкремент х. Значение равно х. 
++х; // инкремент х. Значение равно х+1. 
х--; // декремент х. Значение равно х. 
--х; // декремент х. Значение равно х-1. 
х+=3; // прибавить 3 кх. 

х-=7; // вычесть 7 из х. 

х*=2; // умножить х на два. 

х/=2; // разделить х на два. 

х5=2; // заменить х на х%2. 


В С понятие истины трактуется расширительно 


Иногда нужно знать, является ли выражение истинным или ложным, например 
когда принимается решение, по какой ветви предложения іѓ-е[ѕе идти. В С нет 
ключевых слов гие и ѓаѕе, хотя они обычно определяются, как описано на врезке 
«Истина и ложь» на стр. 191. Вместо этого принято соглашение: если выражение 
равно нулю (или символу '\0', или указателю №), то оно считается ложным, во 
всех остальных случаях – истинным. 

Верно и обратное: значением любого из приведенных ниже выражений являет- 
ся 0 или 1: 


1х // не х } 
х==у // х равно у 

х != у // х не равно у 

х<у // х меньше у 

х <= у // х меньше или равно у 

х Пу // хили у 

х 66 у // хиу 

х> у Пу >= 2 // х больше у либо у больше или равно 2 


Например, если х принимает любое значение, отличное от нуля, то значением !х 
будет нуль, а значением !!х — единица. | 

Операторы ёи || – «ленивые», они вычисляют лишь часть выражения, доста- 
точную для установления истинности или ложности всего выражения. Например, 
рассмотрим выражение (а < 0 || зах (а) < 10). Вычисление квадратного корня из —1 
привело бы к ошибке (см., однако, обсуждение поддержки комплексных чисел в С 
в разделе «_Сепег!с» на стр. 274). Но если а==-1, то мы точно знаем, что выражение 
(а<0 || за (а) < 10) равно їгие, какое бы значение ни принимала его вторая часть. 
Поэтому 59: (а) < 10 вообще не вычисляется, и беды удается избежать. 


Результатом деления двух целых всегда является целое 


Многие программисты стремятся по возможности избегать чисел с плавающей точ- 
кой, потому что вычисления с целыми числами производятся быстрее и не дают 
ошибок округления. В С для этой цели есть три разных оператора: вещественное 
деление, целочисленное деление и взятие остатка. Первые два выглядят одинаково. 
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/Геосогіа1/аіуіѕіопѕ.с 
#1 пс1и4е <5ѕаіо.һ> 


11 таіп() { 
ргіпе# ("3. /5=%а\п", 3./5); 
ргіпе# ("3/5=%1\п", 3/5); 
ргіпе# ("3%%5=%1\п", 3%5); 


Результат получается такой: 
3./5=0.6 


3/5=0 
3%5=3 


Выражение 3. – это вещественное число с плавающей точкой. Если числитель 
или знаменатель — вещественное число, то производится вещественное деление, 
и результатом является вещественное число. Если числитель и знаменатель – це- 
лые числа, то производится вещественное деление, но результат округляется с не- 
достатком до целого. Оператор% возвращает остаток от деления. 

Различие между вещественным и целочисленным делением и есть причина, по 
которой в примере с пем_га{1о было выполнено приведение типа знаменателя в вы- 
ражении пип/ (доџр1е) деп. Дополнительные сведения см. в разделе «Меньше при- 
ведений» в главе 7. 


В С имеется тернарный условный оператор 
Еслиаир – простые выражения, то результатом вычисления выражения 


х?а: ЬЫ 


будет а, если х истинно, и Б, если х ложно. 

Раньше мне казалось, что такая запись непонятна, и к тому же такой оператор 
есть не во всех скриптовых языках, но со временем его полезность стала для меня 
очевидной. Поскольку это просто выражение, мы можем употреблять его где угод- 
но, например: 

//еосогіа1/ѕдгё.с 


#1пс1и4е <таёһћ.һ> // Здесь объявлена функция ѕагі 
#1пс1и4ае <5%41о.в> 


116 ма1л () { 
аоџЬ1е х = 49; 
ргіпёё ("Квадратный корень из х равен%д.\п", 
х > 0 ? загЕ(х) : 0); 
} 


Ветвления и циклы несильно отличаются от других языков 


Пожалуй, единственная особенность С в части предложений 1{-е1зе – отсутствие 
ключевого слова {Неп. Вычисляемое условие заключается в скобки, и если оно ис- 
тинно, то вычисляется следующее выражение или блок. Вот несколько примеров. 
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//єобогіа1/і# е1ѕе.с 
#іпс1џдӢе <ѕбаіо.һ> 


іп маіп() { 
іЇЁ (6 == 9) 
ргіпе# ("Шесть равно девяти. \п"); 


ргіпЁ ("Я знаю, чему равно х: единице. \п"); 
е1зе 1Ё (х==2) 

ргіпёЁ ("х точно равно двумя.\п"); 
е1зе 

рг1пЕЁ("х не равно ни единице, ни двум.\п"); 


В цикле ип! 1е вычисление блока повторяется, пока заданное условие не станет 
ложным. Например, следующая программа приветствует пользователя десять раз: 


//еобогіа1/мћі1е.с 
#іпс1І0џае <5ѕаіо.һ> 


іпё таіп() { 
іп 1=0; 
мһі1е (1 < 10) { 
ргіпеЁ ("Не110о #%1\п", 1); 
ЗФ 


Если управляющее условие в скобках после ключевого слова нћі1е оказывается 
ложным уже при первом вычислении, то тело цикла не выполняется ни разу. Од- 
нако тело цикла йо-%ћі1е гарантированно выполняется хотя бы один раз: 


//еосогіа1/ао мћі1е.с 
#іпс1џде <ѕіадіо.һ> 


уоіа 1оорѕ (іп тах) { 
іп 1=0; 
ао { 
ргіпёЁ ("Не11о #%і\п", 1); 
і++; 
} мһі1е (1 < мах); // Обратите внимание на точку с запятой. 


} 


1пе ма1п() { 
100рѕ (3); // печатаются три приветствия 
1оорз (0); // печатается одно приветствие 


} 


Цикл Гог – просто компактная форма цикла мћіе 
Управление циклом юћі1е состоит из трех частей: 

О инициализация (11 1=0); 

О проверка условия (1 < 10); 

О шаг итерации (1++). 
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В цикле ѓо все три части собраны в одном месте. Следующий цикл Еог эквива- 
лентен показанному выше циклу ићі1е: 


//еосогіа1/ ог 1оор.с 
#1пс1и4е <ѕ0аіо.һ> 


іп таіп() { 
Ғог (іп 1=0; і < 10; 1++) { 
ргіпеё ("Не11о #%1\п", 1); 


Поскольку блок занимает всего одну строку, то даже фигурные скобки можно 
опустить, тогда получится: 


//Сосогіа1/Ёог 100р2.с 
#іпс1џде <ѕаіо.һ> 


іп таіп() { 
Рог (іп 1=0; і < 10; і++) ргіпе# ("Не110о #%1\п", 1); 


} 


Часто возникают сомнения по поводу «ошибки на единицу», когда программист 
хотел выполнить десять итераций, а получил девять или одиннадцать. В приве- 
денном выше варианте (начать с 1=0, проверять условие і < 10) правильно отсчиты- 
вается десять итераций, и это стереотипная форма при обходе массива. Например: 
116 1еп=10; 


аоџЬ1е аггау[1еп]; 
Еог (іпё 1=0; 1< 1еп; 1++) аггау[1] = 1./(1+1); 


Не существует специального синтаксиса для обхода любой последовательно- 
сти или применения операции к любому элементу массива (хотя такой синтаксис 
можно реализовать с помощью макросов или функций), поэтому конструкции 
вида (116 1=0; 1< 10; 1++) будутвстречаться вам очень часто. 

С другой стороны, точно известно, что делать в разных ситуациях. Если тре- 
буется шаг 2, то нужно написать Ёог (11% 1=0; 1< 10; 1+=2). Если нужно продол- 
жать итерации, пока в массиве не встретится нулевой элемент, то пишем Ёюг (11% 
1=0; аггау [1] !=0; 1++). Любую часть цикла можно опустить. Так, если не требуется 
инициализировать новую переменную цикла, то допустимо написать так: ог (; 
аггау[1] !=0; 1++). 


Указатели 


Указатели на переменные иногда называют псевдонимами, ссылками или метками 
(хотя в С имеются не относящееся к указателям и редко используемое понятие 
метки; см. раздел «Метки, роќо, ѕуіёсһ и БгеаК» в главе 7). 

В указателе на йоџр]е находится не само значение типа доц ]е, а адрес области 
в памяти, где это значение хранится. Таким образом, мы получаем два имени для 
одного и того же объекта. Если этот объект изменится, то изменение будет видно 
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через оба имени. И в этом принципиальное отличие от полной копии объекта, по- 
скольку изменение оригинала никак не отражается на копии. 


Можно напрямую запросить блок памяти 


Функция па110с выделяет память для использования в программе. Например, вот 
как можно выделить место для хранения 3000 целых чисел: 


па] 1ос (3000*$12еоЕ (іпё)); 


Это первое упоминание о явном выделении памяти в настоящем руководстве, 
потому что во встречавшихся раньше объявлениях вида 111 [100] память выделя- 
лась автоматически. При выходе из области видимости, в которой находится такое 
объявление, автоматически выделенная память автоматически же и освобожда- 
ется. Напротив, память, выделенная динамически с помощью па11ос, остается за- 
нятой, пока ее не освободят вручную (или до конца программы). Есть ситуации, 
когда такая долговечность весьма желательна. Кроме того, размер массива нельзя 
изменить после инициализации, тогда как динамически выделенную память мож- 
но перераспределить. Другие различия между динамическим и автоматическим 
выделением памяти обсуждаются в разделе «Автоматическая, статическая и ди- 
намическая память» в главе 6. 

Итак, область памяти выделена, но как к ней обратиться? На помощь прихо- 
дят указатели, поскольку мы можем связать псевдоним с областью, выделенной 
па]10с: 


іп *іпёѕрасе = та11ос (3000*$12еоЕ (іпё)); 


Звездочка в объявлении (іпё *) означает, что объявляется указатель на область 
памяти. 

Память – конечный ресурс, поэтому беспечное использование может в конеч- 
ном итоге привести к нехватке памяти – ошибке, с которой все мы когда-то стал- 
кивались. Чтобы вернуть память системе, используется функция ѓгее, например: 
Ғтее (іпёѕрасе). Или можно просто дождаться конца программы, когда операцион- 
ная система сама освободит всю занятую программой память. 


Массивы - это просто блоки памяти, любой блок памяти 
можно использовать как массив 


В главе 6 подробно обсуждаются сходства и различия массивов и указателей, но, 
безусловно, они имеют много общего. 

Массив занимает в памяти непрерывный участок, в котором элементы одного 
типа расположены друг за другом. Если запрашивается элемент 6 массива, объяв- 
ленного как іпї 1131 [100], то система возьмет элемент, отстоящий от начала этого 
участка на 6*512е0# (іпё) байтов. 

Поэтому нотация с использованием квадратных скобок, 1151 [6], – просто обо- 
значение смещения от позиции, занятой именованной переменной. Именно это 
нам и нужно при работе с массивом. Но, имея указатель на непрерывный участок 
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памяти, мы могли бы проделать те же самые операции поиска элемента и продви- 
жения к следующему элементу вручную. 

В следующем примере показано, как заполнить динамически выделенный мас- 
сив и вывести его в файл. То же самое было бы проще сделать, если бы массив вы- 
делялся автоматически, но нам важна демонстрация возможности. 

//коког1а1 /мапоа1_тетогу.с 


#1пс1и4е <5а1ір.һ> //та11ос апа #гее 
#іпс1џаде <5аіо.һ> 


116 ма1л () { 
106 *1п65расе = та11ос (3000*$12еоЕ (іпё)); 
Рог (116 1=0; і < 3000; 1++) 
іпёѕрасе([1] = і; 


РТЬЕ *СсЁ = Еореп("соипеег_#1е", "м"); 
Рог (іп 1=0; і < 3000; 1++) 
Ере1пЕЁ(сЁ, "%1\п", 1пЕзрасе[1]); 


Ғгее (іпёѕрасе); 
Ес1озе (сЁ); 


Память, выделенную с помощью па110с, можно спокойно использовать в про- 
грамме, но она не инициализирована и может содержать мусор. Чтобы выделить и 
обнулить память, пользуйтесь такой функцией: 


116 *іпёѕрасе = са11ос (3000, $12еоЕ (іпё)); 


Обратите внимание, что она принимает два аргумента, а па110с — только один. 


Указатель на скаляр – это по существу массив с одним 
элементом 


Допустим, имеется указатель 1 на целое число. Это массив длины 1, и если мы на- 
пишем 1 [0], то система найдет область, на которую указывает і, и отступит от нее 
на 0 элементов - в точности так же, как для более длинных массивов. 

Но человеку несвойственно рассматривать одиночное значение как массив 
длиной 1, поэтому для часто встречающегося случая одноэлементного массива 
существует специальное соглашение: всюду, кроме строки объявления, і [0] и *і 
эквивалентны. Правда, это может стать источником путаницы, потому что в стро- 
ке объявления звездочка означает нечто совершенно иное. Существуют доводы 
в пользу такого соглашения (см. раздел «Виноваты звезды» в главе 6), ну а пока 
просто запомните, что звездочка в объявлении означает новый указатель, а в лю- 
бой другой строке – значение, на которое указатель указывает. 

В следующем примере в первый элемент массива записывается значение 7. 
В последней строке проверяется, что в нем действительно находится 7, и, если я 
ошибся, программа аварийно завершается. 


//еобогіа1 /аѕѕегі.с 
#іпс1іџае <аѕѕегё.һ> 
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іп таіп() { 
іп 1156 [100]; 
1706 *11512 = 1150; // 11562 объявляется как указатель на іп, 
// указывающий на тот же блок памяти, что и 1іѕі 


*1152 = 7; // 11562 - указатель на іпё, поэтому *1і5ѕ2 - іпё. 


аѕѕегі (1156[0] == 7); 
} 


Существует специальная нотация для доступа к полям 
структур по указателю 
Пусть имеется объявление 


габіо ѕ *рг; 


Тогда мы знаем, что рг – указатель на гаќіо з, а не сама гаїіо з. В памяти для рг 
отведено столько места, сколько занимает указатель, а не вся структура гаїіо з. 

Получить числитель, хранящийся в структуре, на которую направлен указа- 
тель, можно с помощью выражения (*рг) .попегаїог, поскольку (*рг) — это струк- 
тура гаќіо 5, а точка обозначает доступ к полю структуры. Существует также стре- 
лочная нотация, которая избавляет от эстетического неудобства использования 
комбинации скобок и звездочки. Например: 


габіо 5 *рг = ма11ос ($12е0Е (габіо ѕ)); 
рг->потегабог = 3; 


Оба варианта: рг->питегаѓог и (*рг) .пипегаёог — в точности эквивалентны, но 
первый обычно предпочтительнее в силу большей наглядности. 


Указатели позволяют изменять аргументы функции 


Напомним, что функции передаются копии входных переменных, а не сами пере- 
менные. При выходе из функции копии уничтожаются, а оригиналы остаются не- 
изменными. 

Теперь предположим, что функции передается указатель. Копия указателя 
указывает туда же, куда оригинал. Ниже приведена простая программа, которая 
пользуется этой стратегией для модификации переменной, на которую указывает 
аргумент функции. 

/Геобогіа1 /роіпбег іп.с 


#1пс104е <ѕёа1ір.һ> 
#1пс1а4е <5аіо.һ> 


уоіа аоџріе іп(іпё *іп) { 
жіп * 2; 


} 


іп ма1лп() { 
116 *х = па110ос ($12е0 (іпё)); 
*х = 10; 
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аоџріе іп (х); 
ргіпеЁ ("теперь х указывает на%1.\п", *х); 


} 


Функция йоџр1е іп не изменяет іп, но удваивает значение, на которое іл указы- 
вает, *іп. Поэтому значение х, переданное функции йоџр1е іп по указателю, удвои- 
лось. 

Это решение широко распространено, поэтому вы встретите много функций, 
принимающих указатель, а не просто значение. Но что сделать, чтобы передать та- 
кой функции указатель на переменную, содержащую простое значение? Для этого 
предназначен оператор &, который возвращает адрес переменной. Стало быть, если 
х – переменная, то &х – указатель на эту переменную. Это позволяет упростить по- 
казанный выше код. 

//собогіа1/адӣгеѕз іп.с 


#іпс1џае <5ѕа11ір.һ> 
#іпс1џае <ѕіаіо.һ> 


уоіа аоџЬ1іе іп(іпё *іп) { 
іп * 2; 


} 


116 ма1п () { 
116 х = 10; 
аоџр1е іл (&х); 
ргіпёЁ ("теперь х указывает на%1.\п", *х); 


} 


Любой объект где-то находится, и, значит, на него можно 
указать 


Невозможно передать функцию в качестве аргумента другой функции. Не бывает 
массивов функций. Но можно передать функции указатель на функцию и создать 
массив указателей на функции. Не буду вдаваться в детали синтаксиса, а отошлю 
читателя к разделу «Туре4е{ как педагогический инструмент» в главе 6. 

Функции, которым безразлично, с какими данными они работают, а интересны 
только указатели на данные, встречаются на удивление часто. Например, функции 
построения связанного списка не важно, какие данные она связывает; ей нужно 
лишь знать, где они находятся. Другой пример: мы можем передать указатель на 
функцию, то есть иметь функцию, единственная цель которой – вызвать другую 
функцию, передав ей аргументы, на которые известен указатель (а что хранится по 
этому указателю, не важно). Для таких случаев С предоставляет механизм обхода 
системы проверки типов – указатель на уо14. В объявлении 


уоіа *х; 
х может указывать на функцию, на структуру, на целое и вообще на все, что угод- 


но. В разделе «Указатель на ус и структура, на которую он указывает» в главе 10 
приведены примеры использования указателей на уо! для разных целей. 


Глоссарий 


Автоматическое выделение памяти – память для размещения автоматической 
переменной выделяется системой в точке объявления переменной и освобождает- 
ся при выходе из текущей области видимости. 

Автономный тест – код для тестирования небольшой части функциональности 
программы. См. также Интеграционный тест. 

Библиотека – по существу, программа без функции паіп, то есть собрание функ- 
ций, псевдонимов типов и переменных, доступных другим программам. 

Булевы значения – {гие и #а[5е. Названы по имени Джорджа Буля, английского 
математика, жившего в первой половине ХІХ века. 

Внешний указатель – см. Непрозрачный указатель. 

Выравнивание – требование начинать элемент данных на определенной гра- 
нице в памяти. Например, в случае требования о выравнивания на границу 8 бит 
в структуре, содержащей однобитовый элемент сћаг', за которым следует 8-бито- 
вый элемент типа іп, после сћаг могут находиться 7 бит дополнения, чтобы ілі 
начинался на границе 8 бит. 

Гипотеза Сепира-Уорфа – предположение о том, что язык, на котором мы раз- 
говариваем, определяет наши способности к мышлению. В самой слабой форме – 
очевидно, что мы часто мыслим словами. В самой сильной форме утверждает, буд- 
то мы неспособны на мысль, для которой в языке нет слов или конструкций; это 
заведомо не так. 

Глиф – символ, применяемый для письменной коммуникации. 

Глобальная переменная – переменная называется глобальной, если ее область 
видимости совпадает со всей программой. В действительности в С нет глобальной 
области видимости, но если переменная объявлена в заголовке, который с высо- 
кой вероятностью будет включаться в каждый файл с исходным кодом програм- 
мы, то есть все основания считать ее глобальной. 

Глубокая копия – копия структуры, содержащей указатели, куда помещаются 
также и данные, на которые направлены указатели. 

Граф вызовов — диаграмма, состоящая из прямоугольников, соединенных 
стрелками, которая показывает, как функции вызывают друг друга. 

Динамическое выделение памяти – выделение памяти из кучи по запросу про- 
граммиста с помощью функции па110с или са110с с последующим освобождением, 
также по запросу, функцией Ётее. 

Закон Бенфорда – начальные цифры во многих наборах данных распределены 
логарифмически: 1 встречается с частотой примерно 30%, 2 – с частотой 17.5%, ..., 
9 – счастотой 4.5%. 

Интеграционный тест - тест, в ходе которого выполняется последовательность 
действий, затрагивающих несколько частей программы (для каждой из которых 
должен быть также написан собственный автономный тест). 


' Не понятно, что имел в виду автор, говоря об «одпобитовом элементе сһаг», коль скоро 


тип сВаг занимает не менее 8 бит, но пусть это останется на его совести. — Прим. перев. 
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Кадр – область в стеке, где хранится информация о функции (например, аргу- 
менты и автоматические переменные). 

Квалификатор типа – описывает, как компилятор может обрабатывать пере- 
менную. Не связан с самим типом переменной (1п%, Ноа и т. д.). В С допускаются 
только следующие квалификаторы: сопз{, геѕігісі, уо1аЕ 1е, _Аёопіс. 

Кодирование – средства, с помощью которых символы естественного языка 
преобразуются в числовые коды для машинной обработки. См. также А5СИ, мно- 
гобайтная кодировка, широкая кодировка. 

Компилятор – строго говоря, программа, которая преобразует понятный чело- 
веку текст программы в машинные команды. Часто это слово употребляется для 
обозначения совокупности препроцессора, компилятора и компоновщика. 

Компоновщик – программа, которая собирает вместе разрозненные части (от- 
дельные объектные файлы и библиотеки) и согласует ссылки на внешние функ- 
ции и переменные. 

Куча – область памяти, из которой производится динамическое выделение. 
Сравните со стеком. 

Лексема – цепочка символов, рассматриваемая как семантическая единица, на- 
пример имя переменной, ключевое слово или оператор вида * или +. На первом 
шаге грамматического анализа текст разбивается на лексемы; для этой цели пред- 
назначены функции зЕгеок_ги ѕігіок п. 

Макрос – обычно короткий текст, вместо которого подставляется более длин- 
НЫЙ. 

Многобайтная кодировка – кодировка текста, в которой для представления од- 
ного символа естественного языка может использоваться переменное количество 
байтов. Сравните с широкой кодировкой. 

Мьютекс – структура, с помощью которой можно гарантировать, что данный 
ресурс в каждый момент времени использует не более одного потока. 

Непрозрачный указатель – указатель на данные, структура которых неизвест- 
на функции, получающей указатель, что не мешает ей передать указатель другим 
функциям, знающим, как работать с данными. Функция, написанная на скрипто- 
вом языке, может сначала вызвать С-функцию, возвращающую указатель на дан- 
ные, хранящиеся в написанной на С части, а затем другая функция на скриптовом 
языке может воспользоваться этим указателем для работы с теми же данными. 

Область видимости – часть программы, в которой переменная объявлена и до- 
ступна. Принципы хорошего стиля программирования требуют, чтобы область 
видимости любой переменной была как можно уже. 

Оболочка – программа, позволяющая пользователю взаимодействовать с опе- 
рационной системой с помощью командной строки или скриптов. 

Объединение – блок памяти, который можно интерпретировать как место хра- 
нения данных нескольких типов. 

Объект – структура данных и оперирующие ей функции. В идеале объект ин- 
капсулирует некую концепцию и предоставляет ограниченный набор средств для 
взаимодействия с собой из внешней программы. 
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Объектный файл – файл, содержащие машиночитаемые команды. Обычно яв- 
ляется результатом обработки исходного файла кода компилятором. 

Отладчик — программа для интерактивного выполнения откомпилированной 
программы, которая позволяет пользователю приостанавливать программу, про- 
сматривать и изменять значения переменных и т. д. Часто полезна для понимания 
природы ошибок. 

Переменная окружения – переменная, присутствующая в окружении програм- 
мы. Устанавливается родительской программой, обычно оболочкой. 

Плавающая точка — представление числа, близкое к научной нотации вида 
2.3х10^4, в которой имеются показатель степени (в данном случае 4) и мантисса 
(здесь 2.3). Если мантисса известна, то показатель степени позволяет десятичной 
точки «переплыть» в нужную позицию. 

Подмена типа (уре рипппё) – приведение переменной одного типа к другому 
типу с целью заставить компилятор рассматривать ее как объект второго типа. На- 
пример, если имеется объявление зёгисё (іпі а; сћаг *Б:} аѕігисё, то (11) аѕігисі 
будет целым числом, первым элементом структуры (безопасная альтернатива об- 
суждается в разделе «С без зазоров» в главе 11). Часто не переносимо, всегда при- 
знак плохого стиля. 

Пользовательский интерфейс - в контексте библиотеки С включает псевдони- 
мы типов, макросы и объявления функций, призванные облегчить работу пользо- 
вателя с библиотекой. 

Поток – последовательность команд, исполняемая компьютером независимо от 
всех прочих потоков. 

Препроцессор — концептуально – программа, запускаемая до компилятора для 
обработки директив типа #1пс114е и #дейле. На практике обычно является частью 
компилятора. 

Процесс – работающая программа. 

Профилировщик – программа, которая сообщает, на что ваша программа тра- 
тит время. Это позволяет сосредоточить усилия на оптимизации узких мест. 

Скрипт — программа на интерпретируемом языке, например на языке обо- 
лочки. 

Статическое выделение памяти — метод выделения памяти для переменных 
с областью видимости файла и переменных, объявленных внутри функции как 
зва1с. Память для них выделяется до начала работы программы, и переменные 
существуют в течение всего времени ее работы. 

Стек — область в памяти, связанная с выполнением функций. В частности, здесь 
хранятся автоматические переменные. У каждой выполняемой функции есть кадр 
в стеке. Когда вызывается новая функция, ее кадр помещается в стек над кадром 
вызывающей функции. 

Тестовая оснастка — система для прогона последовательности автономных и 
интеграционных тестов. Предоставляет простые средства инициализации и осво- 
бождения вспомогательных структур, а также позволяет обнаруживать отказы, 
которые могут привести к (ожидаемому) останову программы. 
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Функция обратного вызова – функция (А), которая передается в виде аргу- 
мента другой функции (В), с тем чтобы функция В могла вызвать функцию А 
в ходе своей работы. Например, обобщенные функции сортировки обычно при- 
нимают функцию сравнения двух элементов. 

Функция с переменным числом аргументов – функция, принимающая пере- 
менное число аргументов (например, ргіпёғ). 

Цетология – наука о китах. 

Широкая кодировка – кодировка текста, в которой для представления одного 
символа естественного языка используется фиксированное количество байтов. 
Например, в кодировке ОТЕ-32 каждый символ пісойе представлен 4 байтами. 
Сравните с многобайтной кодировкой. 

АЅСП - американский стандартный код для обмена информацией. Стандарт- 
ное сопоставление наивным английским символам чисел из диапазона 0— 127. Со- 
вет: во многих системах команда пап аѕсіі распечатывает таблицу кодов. 

АиќоќёооІѕ – набор программ, поставляемый фондом СМО, призванный автома- 
тизировать компиляцию в любой системе. Включает Ашбосопф, Ащюотаке и 1ЬќооЇ. 

Вѕр - Вегк@еу Зой\аге ГРіѕігірибіоп. Реализация стандарта РОЅІХ. 

САЬ - отладчик СМИ. 

СМУ – Спиѕ № Е Опіх. 

СТ, – СМО баепийс Ггагу. 

ШЕ - Пцергае4 Оеу@ортепе Епугоптепе (интегрированная среда разработ- 
ки). Обычно программа с графическим интерфейсом, в основе которой лежит тек- 
стовый редактор и добавлены средства для компиляции, отладки и другие полез- 
ные программисту возможности. 

Гліпих – строго говоря, ядро операционной системы, но чаще употребляется для 
обозначения всего комплекта программных средств, разработанных В$О, СМО, 
[цегпеё Ѕуѕіетѕ Сопѕогііит, [лпих, Хоге и т. д. и собранных в унифицированный 
пакет. 

МаМ – Мос-а-МитьЬег (нечисло). В стандарте ТЕЕЕ 754 (представление чисел 
с плавающей точкой) так называется результат математически невозможной опе- 
рации, например 0/0 или 105(-1). Часто применяется в качестве признака отсут- 
ствующих или некорректных данных. 

РОЗХ – РоцаЫе Орегабіпе Зузет Іпќегѓасе (переносимый интерфейс опера- 
ционных систем). Разработанный ТЕЕЕ стандарт, которому должны удовлетво- 
рять ОМХ-подобные операционные системы. Описывает состав функций в биб- 
лиотеке С, оболочку и некоторые важнейшие утилиты. 

РЕгеа4 – поток РОЅІХ. Поток, созданный с помощью интерфейса к потокам из 
С, определенного в стандарте РОЅІХ. 

ВМС – генератор случайных чисел. Слово «случайный» здесь означает, что 
между членами генерируемой последовательности чисел нет систематической за- 
висимости. 

ВТЕМ - читай руководство. 
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ЗерфащЕ – нарушение защиты памяти. Обращение к недоступному или несу- 
ществующему адресу в памяти. Приводит к немедленному завершению програм- 
мы операционной системой и потому - в силу общности последствий – часто 
употребляется для обозначения любой ошибки, влекущей за собой аварийный 
останов программы. 

ЗНА - Зесиге Наѕһ А|РогБт. Алгоритм вычисления криптографической конт- 
рольной суммы (хэша). 

501. – Ѕігисіигей Оцегу Гаприаре (структурированный язык запросов). Стан- 
дартизованное средство взаимодействия с базами данных. 

ОТЕ – Опісойе Тгапѕѓогтабоп Еогтаё. 

ХМІ. – ЕжепяЫе Магкир Гапеџаре (расширяемый язык разметки). 
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Прелметный указатель 


Символы 
! оператор НЕ, 88 
#, использование в препроцессоре, 176 
#4еЁ директива, 73 
#т4еЁ, директива, 73 
#нпсде, директива, 31 
защита включения, 182 
#ргарта опсе, 182 
$ (знак доллара), 37 
$(СС), переменная таке, 41 
$0), и обратные апострофы, 86 
$@, перемепная таке, 40 
$*, переменная таке, 40 
$<, переменная таке, 40 
переменные отладчика, 62 
& (амперсанд) 
& &, короткое замыкание в оболочке, 94 
(), скобки 
использование в макросах, 172 
объявление переменных 
до открывающей фигурной скобки, 270 
*, использование с указателями, 147 
. (точка), команда загрузки скрипта 
в оболочке, 86 
@ 
в документации Рохуреп, 75 
в начале строки в таке, 94 
специальные коды СМЕВ, 77 
__ У\УА_АВС$ __, ключевое слово, 213 
_ ВооЇ, тип, 191 
_Сепегс, ключевое слово, 274 
реализация перегрузки, 276 
_Зайс_аззеге, 181 
_ТЬгеа4 юса|, ключевое слово, 226 
` (обратный апостроф) замена команды ее 
выводом, 35, 85 
{} фигурные скобки для оформления 
блоков, 173 
<5(4іпећ>, 167 


А 


аһоге функция, 80 


АС_СНЕСК_НЕАПЕК, макрос, 103 
АС СОМЕІС ЕП.ЕЅ, макрос, 105 
АС ІМІТ, макрос, 105 
АС_ОЧТРУОТ, макрос, 105 
АС РКОС СС С99, макрос, 102 
АМ ІМІТ АОТОМАКЕ, макрос, 105 
АМ_УАВТАВГЕ, макрос, 102 
Апјиќа, 26 
АМЅІС89, 15, 156 
объявления в начале блока, 155 
АМ№ЅІ С89 
и Міѕиа| Ѕіиаіо, 28 
тип широкого символа, 207 
функции с переменным числом 
аргументов, 229 
АрріІе, 25 
Хсоде, 25 
АЗСП (Атегісап ЅќапЯага Сое ог 
Ілѓогтабіоп Іпёегсһапре), 203, 361 
аѕргіпё, функция, 192, 244 
безопасность, 195 
константные строки, 196 
макрос Ѕаѕргіпёѓ, 198, 201 
расширение строк, 197 
аѕѕегї, макрос, 80 
аще, директива, 229 
Ашогоо[5, 29, 43, 83, 361 
АшосопЁ, АисотаКе, Аиѓоѕсап 
и 1Ьооі, 96 
взаимодействие с Рупоп 0155, 131 
компоновка с библиотекой на этапе 
выполнения, 128 
создание пакета, 95 
на примере программы Нео Мог!а, 96 
описание МаКейе в МакеЁе.ат, 100 
условный подкаталог для Ашотаке, 130 


Баѕћ 
смена оболочки при каждом запуске, 92 
целочисленная арифметика, 91 

Ьп (переменная формы), 100 
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ВГА$ (Ваѕіс Глпеаг АІвеђга Ѕирргоргатѕ), 
библиотека, 35 

Ъгеак, предложение, 164 

Вѕр (Вегкејеу Ѕоѓсмаге 

"Ріѕегібибйоп), 18, 361 


С 


С++, 15, 263 
перегрузка операторов, 273 
подправление имен, 52 
приведениетипов, 157 
расширение типа, 252 
С11, 16, 156 
__Сепегіс, ключевое слово, 274 
_Тһгеаа Іоса!, ключевое слово, 226 
сотрІех 4оцЫе, 276 
анонимные элементы в структурах, 257 
копирование значения, возвращенного 
функцией, 144 
необязательность явного возврата 
из таіп, 154 
расположение объявлений, 156 
флаг компилятора есс, 32 
С99, 12, 15, 102 
сотрІех аоџЫе, 276 
егКх), функция ошибок, 31 
копирование значения, возвращенного 
функцией, 144 
необязательность явного возврата 
из тат, 154 
расположение объявлений, 156 
составные литералы, макросы 
с переменным числом аргументов 
и позиционные инициализаторы, 211 
СЕГАС$, переменная окружения, 37, 52, 94 
сһаг сопѕі **, проблема, 189 
сһеск (переменная формы), 100 
сһѕһ, команда смены оболочки, 92 
сІапр, 18, 26 
-5, флаг компилятора, 32 
ГРАОО=-1 Бра -М/|,-ВПБра(®, 36 
-хс, флаг компилятора, означающий, что 
код написан на С, 50 
флаг для включения заголовков, 46 
с1озе г, функция, 243 


Со4е::Ыоск$, 26, 29 
сотріех, ключевое слово, 277 
сопйр.В, заголовок, 105 
сопйриге.ас, скрипт, 97, 104 
для сборки Руфоп-пакета, 130 
добавление кода на языке оболочки, 106 
сопйриге.зсап, файл, 97 
сопйриге, скрипт, 98 
сопѕі, ключевое слово, 186 
отсутствие защиты со стороны 
компилятора, 186 
передача константного указателя 
в функцию, где он неконстантный, 187 
проблема сопѕі сһаг**, 189 
форма существительное- 
прилагательное, 187 
элементы константной структуры, 188 
СїігІ-А, клавиша СМО Ѕсгееп, 90 
сОКІ., 334 
СҰЕВ, 282 
грамотное программирование, 76 
Сурміп 
компиляция программ на С в отсутствие 
подсистемы РОЅІХ, 29 
компиляция программ на С при наличии 
подсистемы РОЅІХ, 28 
установка, 28 
сурміпі1.111, библиотека, 28 
С-оболочка, 37 


р 


ЧЙ, утилита, 109 
015665, 129 

поддержка со стороны Аџќоѓоо/5, 131 
Чореп, функция, 128 
аІѕут, функция, 128 
4очЫе, использование вместо Ноа(, 164 
Рохуреп, 74 


Е 


Ес]Іірѕе, 26, 29 

ЕПІТОК, переменная окружения, 111 
Етасѕ, 26 

Епсег, клавиша, повторение последней 
команды в отладчике, 63 
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еф функция ошибок, 31 
ежегп, ключевое слово, 183 


Е 

с, команда, 90 

ЕіпК, 25 

Ноа тии, почему не следует 


использовать, 164 
юреп, фупкция, 160 
Ғогеасћ, 217 
Гог, циклы, 160 
в оболочке для обработки набора 
файлов, 86 
упрощение для указателей, 149 
Ёгее, функция, 137 
векторизация, 218 


а 


-в, флаг компилятора, 32 

всс (СМУ Сотр!Иег Соїесііоп), 18, 26 
айгие, ключевое слово, 229 
Сурміп, компиляция для Ма СУ\У/ 
и РОЅІХ, 30 
ГОАОО=- ра -№І,-КіБраєћ, 36 
включенный в Сурміп, 28 
переменные окружения для путей, 35 
полная команда вызова, 32 
рекомендуемые флаги 
компилятора, 32 
флаг --тѕ-ехѓепѕіопѕ, 257 
флаг -хс, 50 
флаг для включения заголовков, 46 

5соу, 73 

БАБ, 26, 51, 361 
переменные, 62 
распечатка структур, 63 
экспериментирование, 53 

БА пк, файл с макросами, 53 

веепу, функция, 39 

веорь функция, 163 

Бе ѕігіпеѕ, функция, 193 

Сеѓсехг, 209 

Сіс, программа, 110 
ріс соттіќ --атепа -а, команда, 112 
#16 соттіє -а -т, команда, 111 


возврат рабочего каталога в состояние 
на момент последней выгрузки, 114 
вывод метаданных с помощью рі Іор, 112 
графические интерфейсы, 116 
деревья и их ветви, 115 
создание новой ветви, 115 

копирование репозитория с помощьо ріс 
сІопе, 110 
объединение, 116 
объединение при невозможности 
быстрой перемотки, 117 
перемещение, 117 
просмотр дельт с помощью еіс Ч, 112 
тайник, 114 
центральный репозиторий, 120 

СІАЬ, 320 
обертки для ісопу и средства 
манипуляции Ошсоде, 207 
связанные списки, 64 

отладка, 65 

система обработки ошибок на основе 
типа СЕггог, 82 

СМО, 14, 361 

Спиріоѓ, 282 

СМИ Ѕсгееп, 89 

воѓо, 161 

вргоѓ, 26 

Сгарһуіг, 75 

Егер, флаг -С, 73 

С$1. (СМУ Заепийс Гагагу), 328, 361 
объекты вектора и матрицы, 142 
получение исходного кода и сборка, 43 
типы комплексного числа и вектора, 274 


| 


НАУЕ_РУТНОМ, переменная, 130 
НАУЕ_$ТКОУР символ, 197 


-1, флаг компилятора, добавление пути 
в список каталогов для поиска 
заголовков, 34 


‚ 1сс (ие! С Сотрйег), 32 


ГРАОР-=-1 раб -№І,-ЕіБраѓћ, 36 
1сопу, функция, 207 
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ШЕ (интегрированная среда разработки) 


Со4е::ЫосК$ и Ес]ірѕе, 29 
рекомендации, 26 
і -еІѕе предложение, альтернатива 
ѕуієсћ, 164 
і предложение, использование команды 
оболочки (еѕі, 88 
іпсіџде (переменная формы), 100 
-іпсІџиде флаг, 2сс и сапр, 46 
іпіпе, ключевое слово, 187 
іпстах_ 6, 167 
три 6, 127 
[ЗОЛЕС 8859, 204 


К 


Каќе, 26 

КОеуеор, 26 

К&К, стандарт (примерно 1978), 15 
К5һ, 91 


И 


-1, флаг компилятора, 31 
-Г, флаг компилятора, добавление пути 
в список каталогов для поиска 
библиотек, 34 
ГРАРР, переменная, 102 
ГОЦВ$, переменная, 102 
ПЫБегеу, библиотека, 192 
ГІВКАКҮ РАТН, переменная 
окружения, 35 
І1Ьоо] 
в помощь Аиботаке, 96 
настройка с помощью ІТ ІМІТ, 105 
сборка разделяемой библиотеки, 103 
Піх, 206, 334 
ВЬ (переменная формы), 100 
Іітієѕ.ћ, файл, 167 
Гліпих, 361 
менеджер пакетов, 25 
переменные окружения для путей, 35 
ООВ, отладчик, 52 
переменные, 62 
распечатка структур, 63 
экспериментирование, 53 
[оса] ѕігіпе (о _и8, функция, 208 


Іопе доцЫе, 164 

Іопр іп, 167 

Іопејтр, 162 

ІТ ІМІТ, макрос, 105 


т4, язык, 104 
Масрог($, 25 
Мас, компьютеры 
система ВЅр, 27 
тат, функция, 53 
пеобязательность явного возврата, 154 
таке, 26 
таке 415ссВеск, 98 
встроенные переменные, 39 
создание о-файлов из с-файлов, 41 
такей|с, 36 
автоматическая генерация с помощью 
Ашсотаке, 96 
генерация с помощью Ацбобоо{5, 83 
задание переменных, 37 
и скрипты оболочки, 92 
нестандартная оболочка, 92 
правила, 40 
МакКеНе.ат, файл 
в корневом каталоге с подкаталогом 
для РуПоп-кода, 131 
добавление необходимой 
информации, 103 
описание МаКе е с помощью, 100 
таПос, функция, 137 
и азритЫ, 193 
куча, 138 
приведение возвращенного указателя 
типа сћһаг *, 157 
указатели вне связи с таЙос, 142 
тап, команда, 46 
таз(ег, метка Си, 113 
теттоус, функция, копирование 
массива, 145 
МіпСҰ (Мтипай$ СМО 
Ѓог Міпдомѕ), 29 
ттар, использование для очень больших 
наборов данных, 326 
МҮ, 29 
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папо, текстовый редактор, 26 

МаМ (нечисло), 161, 361 
пометка педопустимых числовых 
значений, 169 

поп (переменная формы), 100 


о 


-о, флаг компилятора, 32 
-ОЗ, флаг компилятора, 33 
оН ео, макрос, 149 
орепа!г, функция, 243 

ореп, системный вызов, 160 


Р 


рас, утилита, 109 
РАТН, переменная окружения, 45 
-ре, флаг компилятора (всс и ісс), 67 
рћеай и рпехѓ, макросы, 64 
ркеђіп (переменная формы), 100 
рке-сопір, 26 
задапие местоположения библиотек 
в таКкеЁе, 44 
компоновка с библиотеками на этапе 
выполнения, 128 
не знает о путях на этапе выполнения, 36 
репозиторий флагов и путей 
к библиотекам, 35 
РОЅІХ, 17, 321, 361 
в Міпдом, 27 
компиляция программ на С 
в отсутствие, 29 
компиляция программ на С 
при наличии, 28 
стандартная оболочка, 84 
флаг сс, 32 
ргіпё, функция 
переменное число аргументов, 228 
спецификатор формата %6, 166 
ргосез$ іг, функция, 243 
рећгеаа, 361 
Русћоп 
интерфейс с С, 128 
015165 при поддержке Ашогоо{5, 131 


компиляция и компоновка, 129 

условный подкаталог 

для Аиотаке, 130 
псевдонимы, 142 


В 
геаЧЧ1г, функция, 243 


$ 


Ѕаѕргіпё, макрос, 198, 201 

ЗНА (Ѕесиге Наѕћ АІеогіһт), 362 

ЗНЕЦШ,, переменная, 92 

$12ео[, оператор, 177, 213 

ѕпргіле, функция, 195 

ѕргіпё, функция, 193 

ЗОГие, 331 

ЗОГ. (структурированный язык 

запросов), 331, 362 

айс, ключевое слово, 263 
внутренняя компоновка, 183 

з(4егг, 80 

ЅСоріє, макрос, 228 

ѕєгаир, 197 

ѕсгіпе_ Ёгот_ е, функция, 208 

ѕсгіеп, функция, 209 

ѕегсок г, функция, 199 

ѕігсоК_ 5, функция, 199 

ѕігсоКк, функция, 199 

(г(011, функция, 127 

ѕміёсћ, предложение, 163 


т 


сеѕї, команда, 88 

Тех, использование совместно 

с СМЕВ, 76 

стих, 89 

сгие и #а[5е, 191 

(гу-саєсћ, конструкции для обработки 

ошибок, 81 

суреде (псевдоним типа) 
использование во вложенном анонимном 
объявлении структуры, 258 
использование в структурах, 222 
как педагогический инструмент, 150 
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Ч А 
Опісоде, 203 Автоматическое выделение 
библиотеки, 206 памяти, 137, 143, 184, 358 
кодировка для программ на С, 205 в стеке, 146 
подсчет частоты встречаемости и массивы, 144 
символов, 244 Автономное тестирование, 69 
средства в СІЛЬ, 320 тестовое покрытие, 73 
Опіх, 15 Автономные тесты, 358 
параллельное развитие с С, 27 
ОТЕ-8, кодировка, 204 Б 
безопасные функции из стандартной Бенфорда закон, 87, 358 
библиотеки, 206 Библиотека 
ОТЕ-32, кодировка, 204, 207 проверка наличия с помощью 
ОТЕ (Опісойе Тгапѕќогтабіоп Аисосопф, 106 
Еогтаб), 362 Библиотеки, 320 
СЬ, 320 
ү СІ. (СМУ $аепийс Г4Ьгагу), 328 
Уа1угіпа, 26 ИБхт] и сОВГ, 334 
использование Уа[ргіпа для поиска РОЅІХ, 321 
ошибок, 67 ЗОГие, 331 
уаѕргіпі, функция, 230 для работы с Опісойе, 206 
уіп, 26 использование во время компиляции 
Уіѕиаї киа, 28 компоновка во время выполнения, 36 
пути, 33 
М флаги компилятора, 31 
проверка наличия, макрос 
-М/ай, флаг компилятора, 33 АС СНЕСК 1В, 106 
-Меггог, флаг компилятора, 33 пути к, 34 


меѓ, утилита, 44 


рекомендуемые, 26 
мһіе, циклы, 160 


сборка из исходного кода, 43 


Уіпаомѕ без прав суперпользователя, 45 
РОЅІХ, 27 сборка разделяемой библиотеки 
компиляция программ на С, 27 с помощью [165090], 103 

в отсутствие подсистемы РОЗ[Х, 29 типичное устройство, 249 


при наличии подсистемы РОЅІХ, 28 Боурна оболочка, 37 


Булевы значения, 358 


Х Быстрая перемотка вперед (Си), 116, 119 
-хс, флаг компилятора, 50 
Хсойе, 25 |=] 
ХМІ, 362 Векторизация функции, 218 
библиотека, 249 Вектор, тип, 274 


Внешние указатели, 127 
2 Внешняя компоновка, 183 
75, 91 Внутренняя компоновка, 184 
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Вспомогательные переменные, 177 
Встроенные документы, 48 
компиляция С-программы 
с помощью, 46 
Выравнивание, 358 
элементов структур, 149 


г 


Генератор случайных чисел, 328 
Глифы, 358 
Глобальная переменная, 358 

и перечисления, 159 
Глубокое копирование, 144, 358 
Грамотное программирование, 76 
Граф вызовов, 75, 358 


д 


Два знака решетки, 177 
Дельты 

и объекты фиксации, 112 

хранение в Си, 112 
Диграфы, 153 
Динамическое выделение памяти, 137, 359 
Дисперсия, однопроходный алгоритм 
вычисления, 165 
Дистанционные репозитории, 118 
Документация 

СМЕВ, 76, 282 

встраиванис в код, 74 

в формате Оохуреп, 74 

Древовидные структуры данных, 115 


З 


Завершение по нажатии клавиши Тар, 84 
Зависимости, 40 
Заголовки 
АС_СНЕСК_НЕАПЕК, макрос, 106 
сопћр.Ь, 104 
включение из командной строки, 46 
упиверсальный, 47 


Интеграционные тесты, 69, 358 
Интерфейсные функции, 249 


Интерфейс с другими языками, 121 

Русћоп как включающий язык, 128 
компиляция и компоновка, 129 
поддержка 0156415 со стороны 
Ашогоо{5, 131 
условный подкаталог 
для Ашотаке, 130 
функция-обертка, 125 

процесс, 124 

структуры данных, 126 


К 


Кадры, 53, 138, 359 
Квалификатор типа, 359 
Кнут Дональд, 76 
Кодирование, 359 
Кодовые позиции, 204 
Комментарии, документация в формате 
"Рохуреп, 74 
Компилятор, 26, 359 
всс и сіапе, 18 
Місгоѕоѓќ С, 28 
проверка и отмена константности, 188 
Компиляция, настройка среды, 24 
библиотеки, 30 
компиляция программ на С 
в Міпаомѕ, 27 
РОЗ Х в УЙпдо\5, 27 
в отсутствие подсистемы РОЅІХ, 29 
при наличии подсистемы РОЅІХ, 28 
работа с менеджером пакетов, 25 
необходимые пакеты, 26 
работа с файлами таКе@е, 36 
сборка библиотек из исходного кода, 43 
Комплексное число, тип, 274 
Компоновка 
ключевые слова ѕѓабіс и ежегп, 183 
со статическими и разделяемыми 
библиотеками, 36 
Компоновщик, 31, 359 
Конечный автомат, 141 
Константные строки, 196 
Конфигурационный файл Юохуреп, 75 
Копирование, 142 
данных по указателю, 144 
содержимого структуры, 143 
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содержимого структуры с помощью 
знака равенства, 254 

Корна оболочка, 28 

Куча, 138, 359 


Л 


Лексемы, 359 
Лицензирование 
Вѕри СМ, 18 
СР1-подобная лицензия 
на сурміпі1.111, 29 
Лямбда-исчисление, 251 


Майкрософт, подсистема для приложений 
на базе Опіх (50А), 28 
Макросы, 359 

СІАЬ, 71 

п14 для Аибосопь 104 

выращивание устойчивых 

и плодоносящих макросов, 172 

для обработки ошибок, 81 

имена с заглавной буквы, 178 

использование # для преобразования 

аргумента макроса в строку, 176 

поиск в архиве макросов Аиќосопё, 107 

проверка ошибок, 228 

с переменным числом аргументов, 213 

чистое расширение строк, 198 
Макросы с переменным числом 
аргументов, 213 

порождение составных литералов, 215 
Массивы 

возврат указателя на автоматический 

массив из функции, 144 

задание размера на этапе 

выполнения, 156 

инициализация нулями, 221 

и указатели, 139 

копирование с помощью теттоуе, 145 

нотация для массивов 

и их элементов, 148 

псевдонимия, 144 

целочисленность индсксов, 158 
Матрицы и векторы в библиотеке СУТ, 260 


Менеджеры пакетов, 25 

Метки, 160 

Многобайтная кодировка, 207, 359 
Многопоточность, 290 

Модель формирования групп, 281 
Мультиплексоры, 89 

Мьюотексы, 359 


н 


Нарушение защиты памяти 
(ѕевѓаши), 362 
Непрозрачные указатели, 127, 359 


о 


Область видимости, 270 
Обобщенные структуры, 244 
Оболочки, 27, 84, 359 
Ёс, команда, 90 
Боурна и С, 37 
встроенные документы, 48 
замена, 91 
замена команды ее выводом, 85 
предоставляемая МтС\У,, 29 
пробелы в именах файлов, 92 
проверка наличия файла, 88 
скрипт инициализации, 111 
циклы для обработки набора файлов, 86 
Обратная трассировка, 53 
\Уаег!пд, 68 
Объединение, 359 
Объединение ветвей репозитория Си, 116 
Объсктно-ориентированное 
программированис на С, 249 
область видимости, 270 
персгрузка, 272 
подсчет ссылок, 277 
расширение структур и словарсй, 251 
функции в структурах, 261 
Объектный файл, 360 
Объекты 
определение, 359 
указатели на, 260 
Объекты фиксации, 110 
дуализм дельты и мгновенного 
списка, 112 


запись нового объекта 
в репозиторий, 112 
получение списка с помощью 
ріс Іор, 112 
применение списка дельт из ветви, 116 
список изменений, 113 
Объявления там, где псобходимо, 155 
Отбрасывание указателя, 262 
Отладка, 51 
добавлепие символов с помощью флага 
-в, 32 
переменные, 62 
распечатка структур, 63 
Отладчик. См. также ва 
запуск из Уает1п, 68 
Ошибки 
извещение о, 226 
макрос для обработки, 214 


п 


Пара ключ/значепие, представление в виде 
объекта, 253 
Перевод на другой язык, 209 
Перегрузка операторов, 272 
_Сепегіс, ключевое слово, 274 
Перемештые 
задание в Аиботаке на уровне 
программы или библиотеки, 102 
задание в таКее, 37 
область видимости, 270 
статические, 137, 140 
объявление, 141 
управление областью видимости 
с помощью фигурных скобок, 173 
Переменные окружения, 37, 360 
для путей, 35 
передача дочерней программе 
при вызове {огК(), 85 
Переменные содержания, 101 
Переменные формы, 100 
Перечисления, достоинства 
и недостатки, 159 
Плохо обусловленные данные, 165 
Повествование в документации, 75 
Подмена типа, 360 
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Подстановка переменных в такс 
и воболочке, 94 
Позиционные инициализаторы, 219, 254 
Покрытие автономными тестами, 73 
Пользовательский интерфейс, 360 
Последовательность чисел Фибоначчи, 
генерация конечным автоматом, 140 
Потоки, определение, 360 
Предупреждения компилятора, 33 
Препроцессор, 176, 360 
Присваивание 
копии и псевдонимы, 142 
элементов разных типов, 157 
Проваливание, 164 
Проверка ошибок, 78 
и контекст, в котором работает 
пользователь, 80 
и реакция пользователя, 78 
способы возврата уведомления 
об ошибке, 81 
Профилирование, 67 
Профилировщик, 360 
Процесс, 360 
Псевдонимия, 142 
и массивы, 144 
Пути, 34 


Р 


Разбиение строки на лексемы, 199 
Разделяемые библиотеки 
компоновка во время выполнения, 36 
флаги компоновщика, 43 
Распределенные системы управления 
версиями, 108 
Расширения, 85, 172 
по маске в 25ћ, 91 
Резервное копирование файлов, 91 


С 


СИ, тип широкого символа, 207 
Связанные списки, 320 

отладка, 65 

отображение в отладчике, 64 
Сепира-Уорфа гипотеза, 250, 358 
Системы управления версиями, 108 
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Скрипты, 360 
Скрипты оболочки 
для проверки тестового покрытия, 74 
и таКеНе, 92 
Словарь, реализация, 253 
События мыши и клавиатуры, 321 
Составные литералы, 212 
порождение с помощью макроса 
с переменным числом аргументов, 215 
применение для инициализации, 213 
Списки 
безопасное завершение, 215 
именованных элементов, 251 
Стандартная библиотеки С, 24 
компоновка, 32 
Стандарты, 15 
Статические библиотеки, компоновка, 36 
Статическое выделение 
памяти, 137, 184, 360 
Стек, 53, 138, 360 
Строки 
вместо перечислений, 160 
и указатели, 151 
объект подстроки, 277 
разбиение на лексемы с помощью 
ѕегсоК, 199 
упрощение обработки за счет 
использования аѕргіпёѓ, 192 
Структуры 
ќогеасћ, 217 
анонимная структура внутри 
обертывающей, 258 
база плюс смещение, 251 
безопасное завершение списков, 215 
векторизация функции, 218 
возврат нескольких значений 
из функции, 225 
выравнивание, 149 
гибкая передача аргументов 
функциям, 228 
закрытые элементы, 271 
инициализация нулями, 221 
интерфейс с другими языками, 126 
использование псевдонимов типов, 222 
копирование, 143 


макросы с переменным числом 
аргументов, 213 

модификация элементов констаитной 
структуры, 188 

позиционные инициализаторы, 219 
распечатка в отладчике, 63 
расширение, 252 

составные литералы, 212 

указатель на уо! и структура, 

на которую он указывает, 239 
функции в, 261 


т 


Тайник (Сі), 114 
Текстовые редакторы 
просмотр страниц руководства, 46 
рекомендации, 26 
Терминальные мультиплексоры, 89 
Тестовая оснастка, 69, 360 
Типы данных 
преобразование между С и включающим 
языком, 125 
присваивание элемента одного типу 
элементу другого типа, 157 
Триграфы, 153 
Тьюринг Алан, 251 


У 


Указатсли, 136 
сһаг * и указатсли, возвращаемые 
таПос, 157 
автоматическая, статическая 
и динамическая память, 136 
арифметические операции, 148 
вне связи с та[ос, 142 
* вобъявлении и вне него, 147 
на объекты, 260 
освобождение памяти, проверка, 68 
передача константного указателя 
в функцию, принимающую 
нсконстантный указатель, 187 
Управление версиями, 108 
Сі, 110 
дистанционные репозитории, 118 
показ изменений с помощью і , 109 


Управление памятью 
таПос и игрища с памятью, 146 
автоматическая, статическая 
и дипамическая память, 136 
виды моделей памяти, 183 
использование Маіргіпа, 68 
Уровепь оптимизации, 33 
Утечки памяти, 198 
поиск с помощь о Ма[егіпа, 69 


Ф 


Файловые системы, 27 
Флаги компилятора, 31 
включение заголовков в рсс и сІапе, 46 
рекомендуемые для повсеместного 
использования, 32 
Функции 
векторизация, 218 
возврат нескольких значений, 225 
в структурах, 261 
вызываемые до или после выполнения 
команды в отладчике, 66 
генерация графа вызовов, 75 
гибкая передача аргументов, 228 
доведение до ума бестолковой 
функции, 233 
нсобязательные и именованные 
аргументы, 231 
объявление по аналогии с ргіпё, 229 
документирование с помощью 
"Юохуџреп, 75 
кадр, 138 
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обертки для вызова из других 
языков, 125 
профилирование, 67 
с обобщенными входными 
параметрами, 239 
тип указателя на функцию, 151 
Функции-обертки 
для С-функций, вызываемых 
из включающего языка, 125 
для функции уравнения идеального 
газа, 129 
Функции с переменным числом 
аргументов, 228, 361 
Функция обратного вызова, 239, 361 


х 


Хэши, 321 
частоты вхождения символов, 244 


Ц 


Цель, в таке, 40 


Центральный репозиторий (СЁ), 120 
Цетология, 200, 361 


Ч 


Чёрч Алонсо, 251 
Числа с плавающей точкой, 165, 360 


Ш 
Широкая кодировка, 207, 361 
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«Для разработки на С вы используете только уі и сс? Управление памятью вызывает такие же 
страдания, как в 90-х годах прошлого века? Бен Клеменс со знанием дела рассматривает 

эти и другие типичные проблемы, демонстрируя, как инструменты, призванные облегчить жизнь 
программиста на © помогают отлаживать код, находить утечки памяти, 

организовывать процесс компиляции и управлять версиями программы.» 

— Дэйв Китабян, 

Руководитель программных разработок, МеСатег ТгІесот 

Выбросьте на свалку старые представления о С и познакомьтесь с языком, который 

давно уже вырос из детских штанишек. Здесь вы узнаете о современных приемах про- 

граммирования, о которых не рассказывают в других учебниках по С. И новичок, и 

ветеран, решивший освежить старые знания, откроет для себя что-то новое. 

Язык С — не просто фундамент всех современных языков программирования, он и 

сам — современный язык, идеальный для написания эффективных приложений пере- 

дового уровня. Забульте об идиомах, когда-то придуманных для старых мэйнфреймов, 

и изучайте инструменты, которые пригодятся для работы с этим преобразившимся 

и вызывающе простым языком. И неважно, какой язык программирования у вас в 
фаворе сейчас — очень скоро вы поймете, что в ХХІ веке С по-прежнему играет рок. 


В это издание включен новый материал о параллельных потоках, виртуальных таблицах, 
числовых типов из стандарта С99 и других средствах. 


Бен Клеменс ( Веп КІетепѕ) занимался статистическим анализом и вычислительно-сложным моде- 
лированием в интересах Брукингского института, Всемирного банка, Национального института 
психического здоровья и правительства С ША. Он также работал в Брукингском институте и в Фонде 
свободного программного обеспечения и многое сделал для того, чтобы авторы сохраняли права на 
написанное ими программное обеспечение. В настоящее время возглавляет группу статистических 
расчетов в исследовательском подразделении Бюро переписи населения США. 
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